JP3964684B2 - Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method - Google Patents

Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method Download PDF

Info

Publication number
JP3964684B2
JP3964684B2 JP2002003153A JP2002003153A JP3964684B2 JP 3964684 B2 JP3964684 B2 JP 3964684B2 JP 2002003153 A JP2002003153 A JP 2002003153A JP 2002003153 A JP2002003153 A JP 2002003153A JP 3964684 B2 JP3964684 B2 JP 3964684B2
Authority
JP
Japan
Prior art keywords
unit
embedded
symbol
embedding
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002003153A
Other languages
Japanese (ja)
Other versions
JP2003209676A (en
Inventor
昌彦 須崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2002003153A priority Critical patent/JP3964684B2/en
Publication of JP2003209676A publication Critical patent/JP2003209676A/en
Application granted granted Critical
Publication of JP3964684B2 publication Critical patent/JP3964684B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,印刷済みの透かし入り文書に対し文字列の追加や消去などの変更が行われた場合に,その文書をスキャナ等でコンュータに入力して処理を行うことにより,原本からの変更の有無やその位置を特定するための電子透かし埋め込み/検出技術に関するものである。
【0002】
【従来の技術】
画像や文書データなどにコピー・偽造防止のための情報や機密情報を人の目には見えない形で埋め込む「電子透かし」は,保存やデータの受け渡しがすべて電子媒体上で行われることを前提としており,透かしによって埋め込まれている情報の劣化や消失がないため確実に情報検出を行うことができる。これと同様に,紙媒体に印刷された文書に対しても,文書が不正に改ざんされたりコピーされることを防ぐために,文字以外の視覚的に目障りではない形式でかつ容易に改ざんが不可能であるような機密情報を印刷文書に埋め込む方法が必要となっている。
【0003】
印刷物として最も広く利用される白黒の二値の文書に対する電子透かし埋め込み方法としては,以下のような技術が知られている。
【0004】
[1]特開平9−179494「機密情報記録方法」
400dpi以上のプリンタで印刷されることを想定する。情報を数値化し,基準点マークと位置判別マークとの距離(ドット数)により情報の表現を行う。
【0005】
[2]特開2001−78006「白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置」
任意の文字列を囲む最小矩形をいくつかのブロックに分割し,それらを2つのグループ(グループ1,グループ2)に分ける(グループの数は3つ以上でも良い)。例えば信号が1の場合はグループ1のブロック中の特徴量を増やしグループ2の各ブロック中の特徴量を減らす。信号が0の場合は逆の操作を行う。ブロック中の特徴量は,文字領域の画素数や文字の太さ,ブロックを垂直にスキャンして最初に文字領域にぶつかる点までの距離などである。
【0006】
[3]特開2001−53954「情報埋込み装置,情報読み出し装置,電子透かしシステム,情報埋め込み方法,情報読み出し方法及び記録媒体」
1つの文字を囲む最小矩形の幅と高さをその文字に対する特徴量として定め,2つ以上の文字間での特徴量の大小関係の分類パターンによりシンボルを表すものとする。例えば3つの文字からは6つの特徴量が定義でき,これらの大小関係のパターンの組合わせを列挙し,これらの組合わせを2つのグループに分類し,それぞれにシンボルを与える。埋め込む情報がシンボル0であって,これを表すために選択された文字の特徴量の組合わせパターンがシンボル1であった場合,6つの特徴量のうちいずれかを文字領域を膨らませるなどして変化させる。変化させるパターンは変化量が最小となるように選択する。
【0007】
[4]特願平10−200743「文書処理装置」
万線スクリーン(細かい平行線で構成された特殊スクリーン)のスクリーン線を後方に移動させるかどうかにより情報を表現する。
【0008】
【発明が解決しようとする課題】
ところで,印刷済みの文書に対する文字の上書きまたは消去などの変更が行われた場合,変更箇所を知るためには原本との比較が必要である。手書きなどで変更が行われた場合には,印刷文字と異なるためにすぐ見分けがつくが,同じフォントで上書き印刷を行った場合などには,変更箇所を見分けることが困難になる。従来例[1]〜[4]の中には,印刷文書内に埋め込んだ情報が正しく読み取れなくなることによって改ざんの有無を判定する方法もあるが,紙面の汚れや印刷時や読み取り時に雑音が付加された場合などでも情報が読み取れなくなるため,検出精度は高くない。
【0009】
本発明は,従来の電子透かし埋め込み/検出技術が有する上記問題点に鑑みてなされたものであり,本発明の目的は,機密情報の検出精度を向上させることの可能な,新規かつ改良された電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出方法を提供することである。
【0010】
【課題を解決するための手段】
上記課題を解決するため,本発明の第1の観点によれば,文書画像に対して電子透かしにより機密情報を埋め込む,電子透かし埋め込み装置が提供される。本発明の電子透かし埋め込み装置(1001)は,前記文書画像を参照して,前記機密情報(1004)を基に透かし画像を作成する透かし画像形成部(1006)を備え,前記透かし画像形成部(1006)は,前記文書画像を,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための埋め込み領域を算出し,前記埋め込み領域に対し,文字領域の割合が所定の閾値以下であるか否かを判断し,文字領域の割合が所定の閾値以下である場合に,前記埋め込み領域の文字領域と重ならない領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット)を所定の数埋め込むことを特徴とする。
【0011】
また,前記透かし画像形成部(1006)は,文字領域の割合が所定の閾値を超える前記埋め込み領域の,文字領域と重ならない領域に,前記シンボルユニットを複数種類,所定の数ずつ埋め込むことを特徴とする。
【0012】
また,前記透かし画像形成部(1006)は,前記埋め込み領域の文字領域と重なる領域に,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)を埋め込むことを特徴とする。
【0013】
また,上記課題を解決するため,本発明の第2の観点によれば,文書画像に対して電子透かしにより埋め込まれた機密情報を検出する,電子透かし検出装置が提供される。本発明の電子透かし検出装置(1002)において,前記文書画像は,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割され,前記各埋め込み領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット),あるいは,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)が埋め込まれることによって,前記機密情報が埋め込まれている。
【0014】
そして,前記機密情報を検出する透かし検出部(1011)を備え,前記透かし検出部は,前記ドットパターンから所定のシンボルを識別可能な複数種類のフィルタを備え,前記各埋め込み領域ごとに,前記複数種類のフィルタによりマッチングを行い,一の前記フィルタのマッチング数が他のすべての前記フィルタのマッチング数に比べて非常に大きい前記埋め込み領域から,前記一のフィルタに対応する,前記機密情報の少なくとも一部を検出することを特徴とする。
【0015】
また,前記透かし検出部は,前記各フィルタのマッチング数の間に差が無い前記埋め込み領域からは,前記機密情報を検出しないことを特徴とする。
【0016】
また,上記課題を解決するため,本発明の第3の観点によれば,文書画像に対して電子透かしにより機密情報を埋め込む,電子透かし埋め込み方法が提供される。本発明の電子透かし埋め込み方法は,以下の第1〜第5工程を含むことを特徴とする。
▲1▼前記文書画像を,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割する第1工程。
▲2▼前記各埋め込み領域ごとに,文字領域の割合が所定の閾値以下であるか否かを判断する第2工程。
▲3▼文字領域の割合が所定の閾値以下である場合に,前記埋め込み領域の文字領域と重ならない領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット)を所定の数埋め込む第3工程。
▲4▼文字領域の割合が所定の閾値を超える前記埋め込み領域の,文字領域と重ならない領域に,前記シンボルユニットを複数種類,所定の数ずつ埋め込む第4工程。
▲5▼前記埋め込み領域の文字領域と重なる領域に,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)を埋め込む第5工程。
【0017】
また,上記課題を解決するため,本発明の第4の観点によれば,文書画像に対して電子透かしにより埋め込まれた機密情報を検出する,電子透かし検出方法が提供される。本発明の電子透かし検出方法において,前記文書画像は,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割され,前記各埋め込み領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット),あるいは,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)が埋め込まれることによって,前記機密情報が埋め込まれている。
【0018】
そして,前記各埋め込み領域ごとに,複数種類のフィルタによりマッチングを行い,一の前記フィルタのマッチング数が他のすべての前記フィルタのマッチング数に比べて非常に大きい前記埋め込み領域からは,前記一のフィルタに対応する,前記機密情報の少なくとも一部を検出し,前記各フィルタのマッチング数の間に差が無い前記埋め込み領域からは,前記機密情報を検出しないことを特徴とする。
【0019】
上記電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出装置によれば,以下のような効果が得られる,
(a)電子透かしを挿入する文書画像の文字の配置状態を参照し,文字領域以外の領域にのみ機密情報の一部を成す有効なシンボルユニットを埋め込むため,元の文書がどのようなものであっても確実に機密情報を埋め込むことができる。
(b)シンボルユニットを埋め込まない領域には,シンボルユニットを複数種類,所定の数ずつ埋め込むことにより,検出時に,機密情報の一部を成す有効なシンボルユニットが埋め込まれていないことを確実に判定できる。
(c)埋め込み情報の検出時に,ある領域に対する複数種類のフィルタの出力値のそれぞれの総和などによりシンボルの判定を行うため,情報検出の精度が高く保たれる。
【0020】
また,前記透かし入り文書画像合成部は,前記機密情報の埋め込み時及び/又は検出時の各種属性情報を,前記透かし入り文書画像の4隅部分に記録することが好ましい。かかる構成によれば,以下の効果が得られる。
(d)埋め込んだ信号数などの属性情報をセットする属性記録領域を信号を埋め込む領域の4隅に設定することで,機密情報を検出する際に入出力デバイスのハードウェア的な誤差に影響されることなく正確に属性情報を取り出すことが可能となり,それ以降の検出精度を向上させることができる。
【0021】
さらに,上記電子透かし検出装置において,改ざん検出を行う機能を追加することが可能である。すなわち,本発明の他の電子透かし検出装置(2001)は,文字消去改ざん検出部(2012)をさらに備え,前記文字消去改ざん検出部は,前記機密情報が埋め込まれた文書画像を所定の閾値で二値化することにより,文字領域の画素値を0,背景領域の画素値を1として文字領域抽出画像を作成し,前記機密情報が埋め込まれた文書画像の,前記シンボルユニットが検出できない領域の画素値を0,シンボルユニットが検出できる領域の画素値を1としてシンボルユニット抽出画像を作成し,前記文字領域抽出画像と前記シンボルユニット抽出画像とを比較することにより(差分画像を生成して),前記透かし入り文書画像に対する改ざんを検出することを特徴とする。かかる構成によれば,さらに以下のような効果が得られる。
(e)印刷された文書に対し,任意の文字列を消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
【0022】
さらに,上記電子透かし検出装置において,改ざん検出のための付加情報を機密情報と共に挿入することにより改ざん検出を行う機能を追加することが可能である。すなわち,本発明の他の電子透かし検出装置(3001)は,前記文書画像に対する前記機密情報の埋め込み時に埋め込まれた前記シンボルユニットの数を検出する,埋め込み信号数検出部(3013)と,前記入力画像に対する前記所定のフィルタの出力値を算出し,各埋め込み領域ごとに記録する,フィルタ出力値算出部(3014)と,前記埋め込み信号数検出部の検出値と,前記フィルタ出力値算出部の算出値とから,前記透かし画像に埋め込まれた前記シンボルユニットの数を検出するための最適な閾値を計算する,最適閾値判定部(3015)と,前記透かし入り文書画像に実際に埋め込まれている前記シンボルユニットの数を検出する,検出信号計数部(3016)と,前記埋め込み信号数検出部の検出値と,前記信号検出計数部の計数値とを比較することにより,前記透かし入り文書画像に対する改ざんの有無を判定する,改ざん判定部(3017)と,をさらに備えたことを特徴とする。
【0023】
かかる構成によれば,さらに以下のような効果が得られる。
(f)文書画像をいくつかのブロックに分割し,各ブロック内に埋め込んだシンボルユニット数を記録することで,ブロック単位で改ざん検出を行うことができ,改ざん場所の特定が可能となる。
(g)埋め込んだ信号数を記録することで,信号検出や改ざん検出のための最適な閾値を求めることができる。
(h)印刷された文書に対し,空白部分に文字列を追加したり,任意の文字列を修正液などで消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
【0024】
【発明の実施の形態】
以下に添付図面を参照しながら,本発明にかかる電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出方法の好適な実施の形態について詳細に説明する。なお,本明細書及び図面において,実質的に同一の機能構成を有する構成要素については,同一の符号を付することにより重複説明を省略する。
【0025】
(第1の実施の形態)
図1は,本発明の第1の実施の形態にかかる電子透かし埋め込み装置及び電子透かし検出装置の構成を示す説明図である。まず,電子透かし埋め込み装置1001についてついて説明する。
【0026】
(電子透かし埋め込み装置1001)
電子透かし埋め込み装置1001は,文書データ1003と,文書に埋め込む機密情報1004を基に文書画像を構成し,紙媒体に印刷を行う装置である。文書データ1003は,フォント情報やレイアウト情報を含むデータであり,ワープロソフト等の文書作成ツール等により作成されたデータである。また,機密情報1004は,紙媒体に文字以外の形式で埋め込む情報であり,文字,画像,音声などの各種データである。
【0027】
電子透かし埋め込み装置1001は,図1に示したように,文書画像形成部1005と,透かし画像形成部1006と,透かし入り文書画像合成部1007と,出力デバイス1008により構成されている。
【0028】
(文書画像形成部1005)
文書画像形成部1005では,文書データ1003を紙面に印刷した状態の画像が作成される。具体的には,文書画像中の白画素領域は何も印刷されない部分であり,黒画素領域は黒の塗料が塗布される部分である。なお,本実施の形態では,白い紙面に黒のインク(単色)で印刷を行うことを前提として説明するが,本発明はこれに限定されず,カラー(多色)で印刷を行う場合であっても,同様に本発明を適用可能である。
【0029】
(透かし画像形成部1006)
透かし画像形成部1006は,機密情報1004をディジタル化して数値に変換したものをN元符号化し(Nは2以上の自然数である。符号化されたビット列を「符号語」と称する。),符号語の各シンボルをあらかじめ用意した透かし信号に割り当てる。本実施の形態は,透かし画像形成部1006による透かしの埋め込み動作に特徴を有する。すなわち,透かし画像形成部1006は,文書データ1003に対し機密情報1004を埋め込む際に,文書データ1003を参照することにより,文書データ1003がどのようなものであっても確実に機密情報1004を埋め込むことができる。透かし信号とその埋め込み動作については,さらに後述する。
【0030】
(透かし入り文書画像合成部1007,出力デバイス1008)
透かし入り文書画像合成部1007は,文書画像と透かし画像を重ね合わせて透かし入りの文書画像を作成する。また,出力デバイス1008は,プリンタなどの出力装置であり,透かし入り文書画像を紙媒体に印刷する。したがって,文書画像形成部1005,透かし画像形成部1006,透かし入り文書画像合成部1007はプリンタドライバの中の一つの機能として実現されていても良い。
【0031】
印刷文書1009は,元の文書データ1003に対して機密情報1004を埋め込んで印刷されたものであり,物理的に保管・管理される。
【0032】
電子透かし埋め込み装置1001は以上のように構成されている。
次いで,透かし画像形成部1006が文書データ1003に対し機密情報1004を埋め込む際に用いられる透かし信号について説明する。
【0033】
(信号ユニット)
透かし信号は,ドット(黒画素)の配列によって任意の波長と方向を持つ波を表現したものである。以下,幅と高さがSw,Shの矩形を1つの信号の単位として「信号ユニット」と称する。図2は信号ユニットの一例を示す説明図である。
【0034】
幅Swと高さShは異なっていても良いが,本実施の形態では説明を容易にするためSw=Shとする。長さの単位は画素数であり,図2の例ではSw=Sh=12である。これらの信号が紙面に印刷されたときの大きさは,透かし画像の解像度に依存しており,例えば透かし画像が600dpi(dot per inch:解像度の単位であり,1インチ当たりのドット数)の画像であるとしたならば,図2の信号ユニットの幅と高さは,印刷文書上で12/600=0.02(インチ)となる。
【0035】
図2(1)は,ドット間の距離が水平軸に対してarctan(3)(arctanはtanの逆関数)の方向に密であり,波の伝搬方向はarctan(−1/3)である。以下,この信号ユニットをユニットAと称する。図2(2)はドット間の距離が水平軸に対してarctan(−3)の方向に密であり,波の伝搬方向はarctan(1/3)である。以下,この信号ユニットをユニットBと称する。
【0036】
図3は,図2(1)の画素値の変化をarctan(1/3)の方向から見た断面図である。図3において,ドットが配列されている部分が波の最小値の腹(振幅が最大となる点)となり,ドットが配列されていない部分は波の最大値の腹となっている。
【0037】
また,ドットが密に配列されている領域はそれぞれ1ユニットの中に2つ存在するため,この例では1ユニットあたりの周波数は2となる。波の伝播方向はドットが密に配列されている方向に垂直となるため,ユニットAの波は水平方向に対してarctan(−1/3),ユニットBの波はarctan(1/3)となる。なお,arctan(a)の方向とacrtan(b)の方向が垂直のとき,a×b=−1である。
【0038】
信号ユニットには図2(1),(2)で示されるもの以外にも,例えば図4(3)〜(5)で示されるようなドット配列が考えられる。図4(3)は,ドット間の距離が水平軸に対してarctan(1/3)の方向に密であり,波の伝搬方向はarctan(−3)である。以下,この信号ユニットをユニットCと称する。
図4(4)は,ドット間の距離が水平軸に対してarctan(−1/3)の方向に密であり,波の伝搬方向はarctan(3)である。以下,この信号ユニットをユニットDと称する。図4(5)は,ドット間の距離が水平軸に対してarctan(1)の方向に密であり,波の伝搬方向はarctan(−1)である。なお,図4(5)は,ドット間の距離が水平軸に対してarctan(−1)の方向に密であり,波の伝搬方向はarctan(1)であると考えることもできる。以下,この信号ユニットをユニットEと称する。
【0039】
(シンボルユニット)
信号ユニットに符号語のシンボルを割り当て,信号ユニットを透かし画像に埋め込むことにより,機密情報1004を透かし画像に埋め込むことができる。以下,符号語のシンボルを割り当てた信号ユニットを「シンボルユニット」と称する。
【0040】
機密情報1004を符号語に変換する際の次元数により,必要なシンボルユニットの数が定まる。機密情報を2元符号化(N=2)する場合には,シンボルユニットを2種類(例えば,ユニットA,ユニットB)用意し,例えば,ユニットAにシンボル0を割り当て,ユニットBにシンボル1を割り当てることができる。また,機密情報を4元符号化(N=4)する場合には,シンボルユニットを4種類(例えば,ユニットA,ユニットB,ユニットC,ユニットD)用意し,例えば,ユニットAにシンボル0を,ユニットBにシンボル1を,ユニットCにシンボル2を,ユニットDにシンボル3を割り当てることができる。
【0041】
(背景ユニット)
さらに,例えば,ユニットEに符号語のシンボルとは無関係のシンボル(例えば,機密語をN元符号化する場合,シンボルN)を割り当て,これを背景ユニットと定義し,これを隙間なく並べて透かし画像の背景とすることができる。以下,符号語のシンボルとは無関係のシンボルを割り当てた信号ユニットを「背景ユニット」と称する。背景ユニットを隙間なく並べて,そこにシンボルユニットを埋め込む場合には,埋め込もうとする位置の背景ユニットと,埋め込むシンボルユニットとを入れ替える。
【0042】
図5(1)はユニットEを背景ユニットと定義し,これを隙間なく並べて透かし画像の背景とした場合を示す説明図である。図5(2)は図5(1)の背景画像の中にシンボルユニットとしてのユニットAを埋め込んだ一例を示し,図5(3)は図5(1)の背景画像の中にシンボルユニットとしてのユニットBを埋め込んだ一例を示している。
【0043】
図5に示した一例においては,各信号ユニット中のドットの数をすべて等しくしているため,これら信号ユニットを隙間なく並べることにより,透かし画像の見かけの濃淡が均一となる。したがって,印刷された紙面上では,単一の濃度を持つグレー画像が背景として埋め込まれているように見える。また,信号ユニットに対するシンボルの割り当ての組み合わせは無数に考えられる。このようにして,第三者(不正者)に透かし信号を簡単に解読できないようにすることができる。
【0044】
(ユニットパターン)
機密情報1004を符号化した符号語の各シンボルについて,単に対応するシンボルユニットを配置していくことによっても,透かし画像に機密情報1004を埋め込むことは可能である。本実施の形態では,第三者による不正な解読を一層防止するために,符号語の各シンボルに対して,信号ユニットの配置パターン(以下,ユニットパターンと称する。)を定義し,ユニットパターンを配置することによって透かし画像に機密情報1004を埋め込む方法について説明する。ユニットパターンの概念について,図6を参照しながら説明する。
【0045】
図6は,本実施の形態で採用するユニットパターンとそのユニットパターンが表すシンボルの一例を示したものである。ここで,1つのユニットパターンを幅(列)×高さ(行)=4×2の信号ユニットの行列とする。また,背景ユニットをユニットE(シンボル2)とし,これに埋め込まれるシンボルユニットをユニットA(シンボル0)及びユニットB(シンボル1)とする。
図6(1)では,ユニットA(シンボル0)を所定の閾値(例えば6)以上配置して,ユニットパターン全体としてシンボル0を表す。
図6(2)では,ユニットB(シンボル1)を所定の閾値(例えば6)以上配置して,ユニットパターン全体としてシンボル1を表す。
図6(3)では,ユニットAとユニットBとをほぼ同数(同数あるいはいずれかのシンボルユニットが1つ多い)配置して,ユニットパターン全体としてシンボル2を表す。
【0046】
以上,電子透かし埋め込み装置1001の構成及び透かし信号について説明した。次いで,電子透かし埋め込み装置1001の動作について,図7〜図13を参照しながら説明する。
【0047】
まず,文書画像形成部1005は,文書データ1003を基に,文書が紙に印刷された状態の画像をページごとに作成する。この文書画像は白黒の二値画像であるものとして説明する。以下の説明中,文書画像の「文字領域」とはプリンタで印刷したときにインク(トナー)を塗布する領域であり,文書画像上では輝度値が0の画素(黒い画素)である。また,「背景領域」とはプリンタで印刷したときにインク(トナー)を塗布しない領域であり,文書画像の輝度値が1である画素(白い画素)のことを示すものとする。
【0048】
透かし画像形成部1006は,機密情報1004から文書画像の背景として重ねあわせる透かし画像を作成する。以下に,透かし画像形成部1006の動作について,図7を参照しながら説明する。図7は,透かし画像形成部1006の処理の流れを示す説明図である。
【0049】
(ステップS1101)
ステップS1101では,機密情報1004をN元符号に変換する。Nは任意であるが,以下では簡単のためN=2(機密情報1004を2元符号に変換する)とする。従って,ステップS1101で生成される符号語は,0と1のビット列で表現されるものとする。このステップS1101では機密情報1004をそのまま符号化しても良いし,暗号化したものを符号化しても良い。
【0050】
(ステップS1102)
ステップS1102では,符号語の各シンボルに対して,図6に示したように,ユニットパターンを割り当てる。
【0051】
(ステップS1103)
ステップS1103では,シンボルユニット配置可否行列を定義する。シンボルユニット配置可否行列は文書画像を1つのブロックの大きさがSw(幅)×Sh(高さ)画素のブロック画像に分割した画像を行列で表したものであり,文書画像の対応するブロックにシンボルユニットを埋め込めるかどうかを表すものである。これは文字領域にシンボルユニットを挿入した場合には検出不可能となるため,あらかじめシンボルユニットを埋め込むことが可能な場所を指定するための行列である。行列の要素の値が1であれば,文書画像の対応するブロックにはシンボルユニットを埋め込むことが可能であり,値が0であれば背景ユニットを埋め込むことになる。ここで,Sw,Shはそれぞれ信号ユニットの幅と高さであり,入力文書画像の大きさをW×Hとするとユニット行列Umの要素数は,
幅(列)×高さ(行)=Mw×Mh=W/Sw×H/Sh
となる。
【0052】
シンボルユニット配置可否行列の各要素は文書画像の対応するブロック中に文字領域が存在するかどうかによって決定する。例えば,シンボルユニット配置可否行列の任意の要素(X,Y)(Y行X列)は入力文書画像のx=X×Sw〜(X+1)×Sw,y=Y×Sh〜(Y+1)×Shの中に含まれている文字領域(輝度値が0の画素)がTn画素以下である場合には1,文字領域がTn画素より大きい場合には0とする。Tnは閾値でありSw×Sh×0.5以下の小さな数とする。
【0053】
図8はシンボルユニット配置可否行列作成の例を示している。図8(1)はシンボルユニット配置可否行列の各要素に対応するブロックを入力文書画像上に重ねて示したものである。図8(2)では各ブロック中に文字領域が含まれている場合に,対応するブロックの値を0としていることを示している。図8(3)では,文字領域判定結果からシンボルユニット配置可否行列の各要素の値を決定している。
【0054】
(ステップS1104)
ステップS1104ではユニットパターン配置可否行列を作成する。これは,文書画像中のこの行列に対応する領域にユニットパターンを挿入可能な場合には要素の値が1となり,挿入不可能な場合は0となる。ユニットパターンを幅(列)×高さ(行)=4×2の信号ユニットの行列と定義すると,ユニットパターン挿入可否の判定は以下のように行う。まず,図8(3)に示したシンボルユニット配置可否行列を4×2の領域に区分する。1つの領域を構成する8個の信号ユニットのうち,所定の閾値Tu個(Tuは6程度)以上がシンボルユニット埋め込み可能(シンボルユニット配置可否行列の値が1)であればユニットパターン埋め込み可能とし,それ以外の場合はユニットパターン埋め込み不可能とする。
【0055】
図9はユニットパターン配置可否行列の作成過程の例を説明した図である。図9(1)は1つのユニットパターンが8つの信号ユニットから構成されていることを示している。図9(2)は各ユニットパターンに対し,対応するシンボルユニット配置可否行列の要素が1である数がTu(=6)以上のユニットパターンには1が,それ以外のユニットパターンには0が与えられていることを示している。図9(3)はユニットパターン配置可否行列の各要素の値をセットしていることを示している。
【0056】
(ステップS1105)
ステップS1105ではユニットパターン配置可否行列を参照してユニットパターン行列を作成する。符号語のシンボルは,ユニットパターン行列中に繰り返しセットされるが,ユニットパターンが埋め込み不可能な要素にはセットされない。例えば図10のように,ユニットパターン行列およびユニットパターン配置可否行列の大きさをPw×Ph=4×4であるとし,符号語のシンボルが(0011)の4ビットであったとする。この図ではユニットパターン配置可否行列の1行2列目の要素の値が0であるため,符号語のシンボルの2ビット目(シンボル0)はセットされずに,シンボル2がセットされ,1行3列目に符号語のシンボルの2ビット目がセットされる。
【0057】
(ステップS1106)
ステップS1106ではユニットパターン行列とシンボルユニット配置可否行列を基にユニット行列Umを作成する。ユニット行列Umはシンボルユニット配置可否行列と同じ大きさであり,信号ユニットの配置パターンを記述する行列である。信号ユニットの配置のルールを以下のように定める。
【0058】
・ステップ1:シンボルユニット配置可否行列において要素が0の位置には背景ユニット(シンボル2)をセットする(図11(1))。
・ステップ2:ユニットパターン行列の要素が符号語のシンボルの場合には,ユニット行列Umの対応する領域にそのシンボルに対応するシンボルユニットをセットする(図11(2))。
・ステップ3:ユニットパターン行列が符号語のシンボル以外(ユニットパターン配置可否行列の値が0)の場合には,0を表すシンボルユニットと1を表すシンボルユニットを同じ数だけセットする(図11(3))。
・ステップ4:信号ユニットがセットされていない領域に背景ユニットをセットする(図11(4))。
【0059】
要約すれば,文字領域には背景シンボルをセットし,任意のユニットパターンのうち背景領域がTu(=6)以上あれば符号語のシンボルを割り当て,それ以外の場合は背景領域に2種類のシンボルユニットを同じ数だけ割り当てる。背景領域が奇数の場合は残りの一つには背景シンボルをセットすることになる。これにより,符号語のシンボルが割り当てられているユニットパターンには同じユニットパターンが6つ以上セットされているため,検出時には埋め込んだシンボルユニットに対するフィルタの出力値の合計値が,もう片方のフィルタの出力の合計値よりも大幅に大きくなり,符号語のシンボルが割り当てられていないユニットパターンは2つのフィルタの出力値の合計の差が小さくなる。したがって,符号語を割り当てたユニットパターンであるか割り当てていないユニットパターンであるかの判定が容易になる効果がある。
【0060】
(埋め込み条件の記録)
電子透かし検出装置1002における入力画像における信号ユニットの大きさは,電子透かし埋め込み装置1001で設定した信号ユニットの大きさ,および出力デバイスの解像度と入力デバイスの解像度の比から計算することができる。
【0061】
例えば,
・電子透かし埋め込み装置1001で文書中に埋め込んだ信号ユニットの大きさが幅×高さ=Sw×Sh(画素)である。
・電子透かし検出装置1002の入力画像における信号ユニットの大きさはSiw×Sihである。
・出力デバイス1008の解像度がDout(dpi),入力デバイス1010の解像度がDin(dpi)である。
とすると,
Siw=Sw×Din/Dout
Sih=Sh×Din/Dout
となる。
【0062】
しかしながらプリンタやスキャナの機械的な精度誤差(DinやDoutが設定通りの値になっていない)により,SiwやSihが必ずしも上記の式のようにはならない。これにより電子透かし検出装置1002の入力画像における信号検出位置にずれが生じ,埋め込んだ機密情報1004の検出精度が低下する。
【0063】
例えばSw=Sh=12,Dout=600でDin=400であるとすると,Siw=Sih=12×400/600=8となるが,DoutやDinに誤差が含まれていてSiwやSihが8とならない場合が考えられる。Siwの誤差が0.1%(0.008画素の誤差,実際はもう少し大きい)であったとしてでも,A4サイズの紙をスキャナ解像度400dpiで取り込んだ場合は,入力画像の大きさはおよそ幅×高さ=3000×4000(画素)程度となり,画像の左端を基準とした場合には画像の右端における位置ずれは3000×0.008=24(画素)となり,3つ分の信号ユニットのずれとなり検出精度に重大な影響を与える。
【0064】
この解決策として,透かし画像に埋め込む信号ユニットの数を,任意の十分大きな整数Nsの倍数としておくことで,入力画像の信号埋め込み領域の大きさから信号ユニットの大きさを逆算するときの誤差の吸収に利用する方法がある。以下では,これとは別の方法について説明する。
【0065】
本実施の形態では,図12に示したように,ユニット行列Umの4隅を透かし画像の埋め込んだ信号ユニット数(ユニット行列Umのサイズ)やプリンタの解像度などの埋め込み条件の記録領域(以下,属性記録領域と称する。)とする方法について説明する。すなわち,図12(1)に示したように,ユニット行列Um(x,y)の大きさをx=1〜Mw,y=1〜MhとしたときにUm(1,1),Um(Mw,1),Um(1,Mh),Um(Mw,Mh)付近を属性記録領域として使用する。
【0066】
図12(2)はユニット行列のサイズをユニット行列の属性情報記録部にセットする例の説明図である。ここではMw,Mhをそれぞれ16ビットで表現し,属性記録領域1に記録する方法を示している。例えばMw=400を16ビットの2進数で表現すると,「0000000110010000」となる。これをユニット行列の表現規則(ステップS1105)にしたがって「1111111221121111」という値に変換する。これをユニット行列Um(2,1)〜Um(17,1)に記録する。同様にMh=600を二進数で表現し,ユニット行列の表現規則に変換し,これをユニット行列Um(1,2)〜Um(1,17)に記録する。
【0067】
図12(2)のUm(2,2)〜Um(17,17)の領域はプリンタの解像度など他の属性を記録しても良いし,電子透かし検出装置1002においてユニット行列のサイズを確実に検出できるよう,MwとMhを繰り返し記録しても良い。また,ここではUm(1,1)〜Um(17,17)を属性記録領域1として使用したが,Um(1,1)〜Um(X,Y)をどの範囲まで広げるかは,属性として記録する情報量やDoutやDinに含まれている誤差などの見積もりによって変化する。さらに,属性記録領域の大きさは既知であるか,または属性記録領域の範囲を属性記録領域自体に記録し,この領域には機密情報1004を埋め込まず,また検出時もこの領域は無視するようにする。図12(2)では属性記録領域1について説明したが,属性記録領域2〜属性記録領域4についても同様である。
【0068】
ユニット画像の4隅に属性情報領域を設定することによる効果は,後述の電子透かし検出装置1002の説明部分で説明する。
【0069】
(ステップS1107)
図13はステップS1107の例を示している。ステップS1107ではステップS1106で作成したユニット行列Um(図13(1))に従って信号ユニットを背景画像に配置する(図13(2))。信号ユニットを並べることにより作成した背景画像に文書画像を重ね合わせ,透かし入り文書画像を作成する(図13(3))。
【0070】
以上,電子透かし埋め込み装置装置1001について説明した。次いで,図1,図14〜図19を参照しながら,電子透かし検出装置1002について説明する。
【0071】
(電子透かし検出装置1002)
電子透かし検出装置1002は,紙媒体に印刷されている文書1009を画像として取り込み,埋め込まれている機密情報1004を復元する装置である。電子透かし検出装置1002は,図1に示したように,入力デバイス1010と,透かし検出部1011により構成されている。
【0072】
入力デバイス1010は,スキャナなどの入力装置であり,紙に印刷された文書1009を多値階調のグレイ画像として計算機に取り込む。また,透かし検出部1011は,入力画像に対してフィルタ処理を行い,埋め込まれた信号を検出する。検出された信号からシンボルを復元し,埋め込まれた機密情報1004を取り出す。
【0073】
以上のように構成される電子透かし検出装置1002の動作について,図14〜図19を参照しながら説明する。
【0074】
(透かし検出部1011,ステップS1201)
図14は透かし検出部1011の処理の流れを示している。
ステップS1201では入力デバイス1010から透かし入り印刷文書の画像を入力する。
【0075】
(ステップS1202)
ステップS1202では入力された画像から信号ユニットが埋め込まれている領域(以下,信号領域と称する。)の輪郭線を検出し,画像の回転などの補正を行う。
【0076】
図15は信号領域の検出方法の説明図である。
図15(1)はステップS1201で入力された画像である。ここでは信号領域の上端を検出する例を示している。入力された画像をImg(x,y),x=0〜Wi−1,y=0〜Hi−1とする。また,電子透かし埋め込み装置1001で文書中に埋め込んだ信号ユニットの大きさが幅×高さ=Sw×Sh(画素),出力デバイス1008の解像度をDout(dpi),入力デバイス1010の解像度をDin(dpi)として,
tSw=SW×Din/Dout
tSh=Sh×Din/Dout
とする。すなわち,tSwとtShはImgにおける理論上の信号ユニットの大きさであり,信号検出フィルタはこの値を基に設計される。
【0077】
この画像Imgから信号領域の上端検出のためのサンプル領域S(x),x=1〜Snを設定する。SnはWi/Np(Npは10〜20程度の整数)であるものとする。また,S(x)の幅はWs=tSw×Nt(Ntは2〜5程度の整数),高さはHs=Hi/Nh(Nhは8程度)とし,S(x)のImgにおける水平方向の位置はx×Npとする。
【0078】
任意のS(n)における信号領域の上端SY0(n)の検出方法を以下に示す。
・ステップ1:ImgからS(n)に対応する領域を切り取る(図15(1))。
・ステップ2:S(n)に対してフィルタAとフィルタBを施し,S(n)内の水平方向における最大値をFs(y)に記録する(図15(2))。
・ステップ3:ある閾値Tyを設定し,Fs(1)〜Fs(Ty−1)の平均値をV0(Ty),Fs(Ty)〜Fs(Hs)の平均値をV1(Ty)とする。V1(Ty)−V0(Ty)が最大となるTyをS(n)における信号領域の上端の位置としてSY0(n)にセットする(図15(3))。
【0079】
図15(4)はFs(y)のyに対する値の変化を示した図である。図のようにImgの信号ユニットのない領域は信号検出フィルタの出力値の平均値は小さく,一方文書画像出力部1001によって背景部分にはシンボルユニット(ユニットAまたはユニットB)を密に配置しているため信号検出フィルタの出力値が大きくなる(文書の余白部分は背景部分であり,ここにも密に埋め込んである)。したがって,信号領域とそれ以外の領域の境界付近を境に信号検出フィルタの出力値が大きく変動し,これを領域検出に利用している。
【0080】
ステップ1〜ステップ3をS(x),x=1〜Snについて行いSY0(x),x=1〜Snを得る。信号領域の上端はこれによって得られたサンプル点S0(x×Np,SY0(x)),x=1〜Snを最小二乗法などを用いて直線近似して得る。他の輪郭線も上記と同様の方法を用いて検出し,例えば信号領域の上端が水平になるように信号領域を回転移動した画像を以下では入力画像と呼ぶ。
【0081】
図16は属性領域に埋め込まれたユニット行列の大きさを復元する方法の例を示している。ここでは,入力画像の信号領域は(Ix0,Iy0)〜(Ix1,Iy1)とし,属性記録領域1の情報を復元する例を示す。
・ステップ1:入力画像の(Ix0,Iy0)付近の領域を切り取る(図16▲1▼)。
・ステップ2:切り取られた領域に対して属性領域1を設定する(図16▲2▼)。属性領域1は文書画像出力部1001で設定したものと同じものであるとし,例えばMwを16ビットで表したときの最上位ビットは(Ix0+tSw,Iy0)に,最下位ビットは(Ix0+tSw×17,Iy0)に埋め込まれているものとして検出する。
・ステップ3:ステップ2で設定したMwの埋め込み領域に対し,フィルタAとフィルタBを施し,各ビット位置でフィルタAとフィルタBの出力値の大きいほうに対応するシンボルユニットが,そのビット位置に埋め込まれているものと判定する(図16▲3▼)。
・ステップ4:文書画像出力部1001でセットしたときと逆の順序でMwの値を復元する(図16▲4▼,▲5▼)。
【0082】
入力画像における信号ユニットの大きさの理論値tSw,tShは誤差が含まれているものの,属性記録領域における信号検出位置は,図15で検出した境界線をそれぞれ基準としているため,例えばSw=Sh=12,Dout=600,Din=400の場合では,tSw=tSh=12×400/600=8であるため,属性記録領域は8×17=136画素程度の大きさしかなく,仮に誤差が1%(実際はこれより少ない)程度であっても属性領域の基準点から最も離れた位置でも1画素程度の誤差となり,ほぼ正確に信号検出位置を設定することが可能となる効果がある。
【0083】
入力画像における信号ユニットの真の幅Siwは,属性記録領域から取り出されたユニット行列の幅Mwと図15から得られた信号領域の幅Ix1−Ix0を基に,
Siw=Mw/(Ix1−Ix0)
によって算出できる。同様に信号ユニットの真の幅Sihは,
Sih=Mh/(Iy1−Iy0)
によって算出できる。
【0084】
(ステップS1203,S1204)
図17はステップS1203とステップS1204の説明図である。ステップS1203はユニットパターンごとにフィルタ出力値の合計を計算する。図17において,ユニットパターンU(x,y)を構成する信号ユニット毎にフィルタAとのコンボリューション(たたみこみ積分)を計算し,それぞれの信号ユニットに対するコンボリューションの出力値の総和をユニットパターンに対するフィルタAの出力値Fu(A,x,y)と定義する。ただし,信号ユニット毎のコンボリューションは,フィルタAの位置を信号ユニット毎に水平・垂直方向にずらしながら計算した結果の最大値とする。
【0085】
フィルタBについても同様にしてユニットパターンU(x,y)に対する出力値Fu(B,x,y)を計算する。
【0086】
ステップS1204ではFu(A,x,y)とFu(B,x,y)を比較し,これらの差の絶対値|Fu(A,x,y)−Fu(B,x,y)|があらかじめ定められた閾値Tpより小さければ符号語のシンボルが割り当てられていないものとする。それ以外の場合はFu(A,x,y)とFu(B,x,y)の大きいほうのシンボルが割り当てられているものと判定する。すなわち,Fu(A,x,y)>Fu(B,x,y)であればU(x,y)にはシンボル0が埋め込まれ,Fu(A,x,y)<Fu(B,x,y)であればU(x,y)にはシンボル1が埋め込まれているものとする。
【0087】
図18はステップS1203とステップS1204を実現する別の方法の説明図である。図18において,図17と同様にユニットパターンU(x,y)を構成する信号ユニット毎にフィルタAとのコンボリューションを計算する。このときシンボルユニット検出のための閾値Tsを定め,各信号ユニットに対するフィルタAのコンボリューションがTs以上であれば,この信号はシンボルAであると判定する。ユニットパターンU(x,y)内においてシンボルAであると判定された数をユニットパターンU(x,y)に対するフィルタAの出力値Fu(A,x,y)と定義する。ただし,信号ユニット毎のコンボリューションは,フィルタAの位置を信号ユニット毎に水平・垂直方向にずらしながら計算した結果の最大値とする。
【0088】
フィルタBについても同様にしてユニットパターンU(x,y)に対する出力値Fu(B,x,y)を計算する。
【0089】
Fu(A,x,y)とFu(B,x,y)がユニットパターン内で検出された信号数であることを除き,ステップS1204の処理は図17と同じとなる。
【0090】
入力画像から得られるすべてのユニットパターンに対して図17または図18,もしくは図17と図18の処理を同時に行い,ユニットパターン行列Uを作成する。
【0091】
(ステップS1205)
ステップS1205では判定されたシンボルを基に埋め込まれた情報を復号する。図19はユニットパターン行列から符号語を取り出す方法の例を示している。図19ではシンボルが割り当てられていない要素にはシンボル2がセットされているものとし,シンボル2がセットされている要素を無視してシンボルを取り出して符号語を復元する。
【0092】
以上説明したように,本実施の形態によれば,以下の効果が得られる。
(a)透かしを挿入する文書画像の文字の配置状態を参照し,文字に重ならない領域にのみ意味のある情報(符号語のシンボル)を埋め込むため,元の文書がどのようなものであっても確実に機密情報を埋め込むことができる。
(b)符号語のシンボルを埋め込まない領域には,相反する信号ユニットを同じ数だけ配置することにより,検出時にシンボルが埋め込まれていないことを確実に判定できる。
(c)埋め込み情報の検出時に,ある領域に対する2つのフィルタの出力値のそれぞれの総和などによりシンボルの判定を行うため,情報検出の精度が高く保たれる。
(d)埋め込んだ信号数などの属性情報をセットする属性記録領域を信号を埋め込む領域の4隅に設定することで,機密情報を検出する際に入出力デバイスのハードウェア的な誤差に影響されることなく正確に属性情報を取り出すことが可能となり,それ以降の検出精度を向上させることができる。
【0093】
(第2の実施の形態)
図20は,本発明の第2の実施の形態にかかる電子透かし埋め込み装置及び電子透かし検出装置の構成を示す説明図である。第1の実施の形態と異なる点は,電子透かし検出装置2002に文字消去改ざん検出部2012が追加された点である。ここで,電子透かし埋め込み装置1001の構成および動作は第1の実施の形態と同一であるものとする。
【0094】
(文字消去改ざん検出部2012)
文字消去改ざん検出部2012は,印刷文書1009に対して文字部分を修正液などで消去するなどの改ざんが行われた場合に,改ざんの有無および改ざん場所を検出する処理を行う部分である。
【0095】
図21は文字消去改ざん検出部の動作を示す流れ図である。
ここで想定している改ざんは,印刷文書1009の文字部分一部が修正液などで消去されたような場合である。改ざん検出の基本的な原理は以下の通りである。電子透かし埋め込み装置1001により作成された印刷文書1009には,
(1)文字領域には背景ユニットが埋め込まれており,シンボルユニットは埋め込まれていない。
(2)背景領域(文字領域以外の領域)にはシンボルユニットが密に埋め込まれている。
という特徴がある。このため,(印刷文書の)文字領域を消去することによってその領域を背景領域に改ざんされても,その部分に新たにシンボルユニットを埋め込むことが困難であるため,信号検出時に「背景領域であるにもかかわらずシンボルユニットが埋め込まれていない領域(不正な領域)」が出現することを利用している。
【0096】
以下の説明では,入力デバイス1010で入力された画像に対して回転などの補正を行った画像を,第1の実施の形態と同様に入力画像と呼ぶ。
また,
・電子透かし埋め込み装置1001で文書中に埋め込んだ信号ユニットの大きさが幅×高さ=Sw×Sh(画素)である。
・埋め込んだ信号ユニット数は,横×高さ=nw×nhである。
・埋め込んだシンボルユニットはユニットAとユニットBの二種類である。
・入力画像における信号ユニットの大きさはSiw×Sihである。
という前提で説明を行う。
【0097】
ここで,出力デバイスの解像度と入力デバイスの解像度が等しい場合には,Siw=Sw,Sih=Shとなるが,解像度が異なる場合にはそれらの比によってSiwとSihが計算される。例えば出力デバイスの解像度が600dpiで入力デバイスの解像度が400dpiであった場合には,Siw=Sw×2/3,Sih=Sh×2/3となる。
【0098】
(ステップS2101)
ステップS2101では入力画像を二値化することによって文字領域を検出する。入力デバイスによって入力された画像において,文字領域は輝度値が小さく(黒に近い色),背景領域は輝度値が大きい(白に近い色)。印刷文書には全面に透かし信号が埋め込まれているが,透かし信号は単位面積当たりのドットの数が文字領域に比べて非常に少ないため,二値化処理によって,透かし信号を含む背景領域と文字領域とを切り分けることができる。二値化の閾値はあらかじめ定めておいても良いし,入力画像の輝度値の分布から判別分析法などの画像処理手法を用いて動的に定めても良い。
【0099】
図22は,文字領域抽出画像の説明図である。
二値化された画像において,文字領域に対応する画素値を0,背景領域に対応する画素値を1と定める。二値化によって得られる画像をさらにnw×nhの大きさに縮小した画像を文字領域抽出画像と呼ぶ(図22)。縮小する際は縮小前の二値画像のSiw×Sih画素ブロックから1画素の値を決定するが,縮小前の二値画像のSiw×Sih画素のうち値が0である画素が所定の閾値Tn以上であれば,それに対応する文字領域抽出画像の画素値を0とする。閾値TnはSiw×Sih×0.5程度の値とする。
【0100】
ステップS2102では入力画像に対してユニット行列Umの作成およびシンボルユニットの検出を行い,ユニット抽出画像を生成する。
【0101】
(ステップS2102)
図23はステップS2102の説明図である。まず,入力画像をnw×nh個のブロック(1ブロックの大きさはSiw×Sih)に分割し(図23(2)),分割されたブロックごとに信号検出フィルタによりシンボルユニットの検出を行う。
【0102】
シンボルユニットが検出できたかどうかの判定は図18の説明と同様に,信号検出フィルタAまたはBのどちらかの出力値が閾値Tsを超えた場合,そのブロックにはシンボルユニットが埋め込まれていると判定する。ここでは,どちらの信号が埋め込まれているかを区別する必要がないことに注意する。すべてのブロックに対してシンボルユニットの検出が行われた結果を画像で表したものをユニット抽出画像と呼ぶ(図23(3))。ユニット抽出画像の大きさは分割されたブロック数と同じでSw×Shである。図23のユニット抽出画像において,画像の大きさは白い画素(画素値は1)はシンボルユニットが検出されたものとし,黒い画素(画素値は0)はシンボルユニットが検出できなかったものとする。
【0103】
(ステップS2103)
ステップS2103ではステップS2101で作成した文字領域抽出画像とステップS2102で作成したユニット抽出画像を比較し,改ざんを検出する。入力画像の文字領域に重なる部分にはもともとシンボルユニットを埋め込んでいない,すなわち背景部分にのみシンボルユニットを埋め込んでいるため,ユニット抽出画像におけるシンボルユニット検出領域(画素値は1)と文字領域抽出画像における背景領域(画素値は1)は一致する。したがって文字領域抽出画像とユニット抽出画像の差分画像を生成し,値が0にならない領域が「印刷文書(紙)に対して辞書消去による改ざんが行われた部分」として検出される。
【0104】
図24はステップS2103の説明図である。ここでは改ざんが行われていないため,差分画像はすべての画素の値が0となる。
【0105】
図25は改ざんがあった場合の説明図である。入力画像の文字領域が消去されており,文字領域抽出画像のそれに対応する領域からは文字領域が抽出されないため画素値が1となる(図25(3))。しかしながら同じ領域からユニットシンボルは検出されないため,ユニット抽出画像の対応する領域は画素値が0となる(図25(6))。したがって,これらの差分画像を計算したときに画素値が0とならない領域が出現し,ここが改ざん場所であることが特定できる(図25(9))。
【0106】
なお,信号ユニットの大きさを非常に小さいものにし,1つの文字の隙間にもシンボルユニットを埋め込むことによって,修正液等で文字を消去して上から異なる文字を上書したとしても,文字の隙間に埋め込んだシンボルユニットが消されているため,これが検出不能になる。したがってこれを利用すれば,ユニット抽出画像において,シンボルユニットが全く検出できない領域があれば,改ざんされている可能性があるとすることも可能である。
【0107】
文字領域抽出画像およびユニット抽出画像は,それぞれ領域拡大縮小などの画像処理手法を用いて雑音除去等を行って高周波成分を除去した後,改ざん検出を行っても良い。これにより,雑音成分に影響されずに安定した改ざん検出を行うことが可能となる。
【0108】
以上説明したように,本実施の形態によれば,以下の効果が得られる。
(e)印刷された文書に対し,主に任意の文字列を修正液などで消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
【0109】
(第3の実施の形態)
図26は本発明の第3の実施の形態の構成を示す図である。第1の実施の形態と異なる点は,電子透かし埋め込み装置3001に埋め込み信号数記録部3012が追加され,電子透かし検出装置3002に埋め込み信号数検出部3013,フィルタ出力値算出部3014,最適閾値判定部3015,検出信号計数部3016および改ざん判定部3017が追加された点である。ここで,その他の構成要素の動作は第1の実施の形態と同一であるものとする。
【0110】
(埋め込み信号数記録部3012)
埋め込み信号数記録部3012は,透かし画像に埋め込む信号数を透かし画像自体に記録する部分である。この信号数は原文の文書画像の文字数やレイアウトに依存して変化する。
【0111】
(埋め込み信号数検出部3013)
埋め込み信号数検出部3013は埋め込み信号数記録部3012で記録した数値を復元し,透かし画像作成時に埋め込んだ信号数を取り出す。
【0112】
(フィルタ出力値算出部3014)
フィルタ出力値算出部3014では入力画像に対する信号検出フィルタの出力値を計算し,信号埋め込み位置ごとに記録する。
【0113】
(最適閾値判定部3015)
最適閾値判定部3015ではフィルタ出力値算出部3014で計算した出力値と埋め込み信号数検出部3013で得た埋め込み信号数を利用して,信号検出のための最適な閾値を計算する。
【0114】
(検出信号計数部3016)
検出信号計数部3016は最適閾値判定部3015で得られた閾値を用いて入力画像に埋め込まれた信号数を数える。
【0115】
(改ざん判定部3017)
改ざん判定部3017は,埋め込み信号数検出部3013で記録した正解数と検出信号計数部3016で得られた信号数を比較することにより改ざん等が行われたかどうかの判定,および改ざん場所の特定を行う。
【0116】
(埋め込み信号数記録部3012)
図27は埋め込み信号数記録部3012の動作を示す流れ図である。
【0117】
(ステップS3101)
図28はステップS3101の説明図である。ステップS3101では,まずユニット行列Um(図28(2))の左端のIw個分の要素を埋め込みシンボルユニット数の記録用のユニット(記録用ユニット帯と呼ぶ)として使用する(図28(3))。次に,ユニット行列Umの記録用ユニット帯を除いた部分を(横×縦=)Bw×Bh個のブロックに分割する(これをユニット数記録単位行列Nu(x,y)x=1〜Bw,y=1〜Bhと呼ぶ)。各ブロックの大きさはユニット行列Umの要素数を大きさの単位として(幅×高さ=)bw×bhとする(図28(4))。
【0118】
ユニット行列Umの左端に記録用ユニット帯を配置する場合,ユニット数記録単位行列に関して設定可能なパラメータは,横方向のブロック数,ブロックの高さ方向の大きさである。残りの縦方向のブロック数とブロックの幅方向の大きさは,設定したパラメータおよび記録用ユニット帯の幅,ユニット行列Umのパラメータから自動的に決定される。
【0119】
以下の説明では,ユニット行列Umの大きさ(要素数)をMw×Mhとしたとき,横方向のブロック数をBw=4,ブロックの高さ方向の大きさをbh=16,記録用ユニット帯の幅をIw=4とする。したがって,縦方向のブロック数はBh=Mh/bh=Mh/16,ブロックの幅方向の大きさはbw=(Mh−Iw)/Bw=(Mh−4)/4となる。
【0120】
(ステップS3102,ステップS3103)
図29はステップS3102およびステップS3103の説明図である。ステップS3102ではユニット行列Umにおいてユニット数記録単位行列の各要素に対応する領域に含まれるシンボルユニットの数を計測する。図29の例ではユニット数記録単位行列Nu(X,Y)におけるシンボルユニット数の計測方法を示しており,以下のステップにより実行される。
・ステップ1:Nu(X,Y)に対応するユニット行列Um上での領域を取り出す(図29▲1▼,▲2▼)。
・ステップ2:ステップ1で取り出された領域内に埋め込まれているシンボルユニットの数を計測する(図29▲3▼,▲4▼)。
ここで,シンボルユニットの埋め込み規則は第1の実施の形態で説明したものと同様に,入力文書画像の文字領域にはシンボルユニットは埋め込まれていないものとする。図29の例では,この領域に埋め込まれたシンボルユニット数は71であったものとする。
【0121】
ステップS3103はステップS3102で計測されたシンボルユニット数を記録用ユニット帯に記録する。以下にそのステップを示す。
・ステップ3:N(X,Y)=71を二進数で表現する(図29▲6▼)。
・ステップ4:ステップ3の結果を記録用ユニット帯の対応する領域にセットする。(図29▲7▼,▲8▼)
【0122】
ここで示した例は,ユニット数記録単位行列の1行に対応するユニット行列Umの行数bhを16,記録用ユニット帯の幅Iwを4としているため,ユニット数記録単位行列の各行に対して記録用のユニット数はIw×bh=4×16=64となる。またユニット数記録単位行列の列数Bwは4であるため,ユニット数記録単位行列の1つの要素に割り当てられる記録用のユニット数(単位記録ユニット数と呼ぶ)はIw×bh侶w=64/4=8となる。したがって,ユニット記録単位行列の各行に対応する記録用ユニット帯の1〜2行目にはユニット記録単位行列の1列目の情報を,3〜4行目には2列目,5〜6行目には3列目,7〜8行目には4列目の情報をそれぞれ単位記録ユニット数(8ビット)で記録することになる。
【0123】
この例ではユニット数を記録しているが,ユニット記録単位行列の「各要素に対応するユニット行列Umの領域中に埋め込むことができる信号ユニット数の最大値」に対する「シンボルユニット数」の割合を記録しても良い。割合を記録する方式は,「ユニット記録単位行列の各要素に対応するユニット行列Umの範囲が大きく,その中に含まれるユニット数も多くなり,この数を表現するために必要なビット数が単位記録ユニット数を超えるような場合」や「ユニット記録単位行列の列数を増やしたため,ユニット記録単位行列の一つの要素の情報を表現するために割り当てられる単位記録ユニット数が少なくなった場合」に有効となる。また,改ざん場所の特定はユニット記録単位行列の要素単位に行うため,同じ入力文書画像に対してユニット記録単位行列の行数や列数を増やすことにより,印刷文書に対する改ざん場所の特定を詳細に行うことが可能になる利点があるが,それだけ記録用ユニット帯を大きく取るか,または単位記録ユニット数を小さくする必要がある。
【0124】
なお,記録用ユニット帯は文書画像の文字領域に重ならないよう,文書画像の余白部分に設定する。また,記録用ユニット帯はユニット行列Umの右端,または上端,下端に設定しても,以降の処理を「記録用ユニット帯が文書画像の上下にある」という前提で行えば同じ効果が得られる。
【0125】
さらに,ユニット行列Umの左右に記録用ユニット帯を設定し,それぞれ同じ情報をセットしても良い。この場合,用紙が汚れたりして片方の記録用ユニット帯の情報が読み取れなくなった場合でも,もう一方の記録用ユニット帯から情報を読み取ることにより,安定して改ざん検出等の処理を行うことができる効果がある。これは上下方向についても同様である。
【0126】
なお,記録用ユニット帯を文書画像のどこに設定したかは,第1の実施の形態で説明した属性記録領域に記述することにより,既知である必要はなくなる。
【0127】
(埋め込み信号数検出部3013)
以下の説明では第2の実施の形態の説明と同様に,
・電子透かし埋め込み装置3001で文書中に埋め込んだ信号ユニットの大きさがSw×Sh(画素)である。
・埋め込んだ信号ユニット数は,横×高さ=nw×nhである。
・埋め込んだシンボルユニットはユニットAとユニットBの二種類である。
・入力画像における信号ユニットの大きさはSiw×Sihである。
という前提で説明を行う。
【0128】
図30は埋め込み信号数検出部3013の説明図である。埋め込み信号数の検出は以下のステップで行う。
・ステップ1:入力画像をSw×Sh個のブロックに分割して,ユニット行列Umを設定する(図30▲1▼)。
・ステップ2:ユニット行列Umの記録用ユニット帯に相当する部分を取り出す(図30▲2▼)。
・ステップ3:記録用ユニット帯に信号検出フィルタを施すことによって埋め込んだビット列を復元する(図30▲3▼,▲4▼)。図29▲3▼において,記録用ユニット帯に相当するユニット行列Umの各要素に対応する入力画像上の領域に対し,2つのフィルタ(フィルタAとフィルタB)の出力値を計算し,出力値が大きいほうのフィルタに対応するシンボルユニットが埋め込まれているものとする。この例ではフィルタAの出力値が大きいためユニットA(シンボル0)が埋め込まれていると判定されている。
・ステップ4:復元されたビット列を基にユニット数記録単位行列を復元する(図30▲5▼)。
【0129】
(フィルタ出力値算出部3014)
図31はフィル出力値算出部3014の説明図である。
ここでは埋め込み信号数検出部で設定したユニット行列Umの各要素に対して,以下のステップにより信号検出フィルタの出力値を記録する。
・ステップ1:ユニット行列Umの任意の要素に対応する入力画像の領域に対して信号検出フィルタ(フィルタAとフィルタB)の出力値を計算する(図30(1))。信号検出フィルタはそれぞれ対象とする領域に対して上下左右にずらしながら出力値を計算し,フィルタAによる出力値の最大値とフィルタBによる出力値の最大値の大きいほうを求める。
・ステップ2:ユニット行列Umのすべての要素についてステップ1を行い,出力値をフィルタ出力値行列Fm(x,y),x=1〜Sw,y=1〜Shの対応する要素に記録する。
【0130】
(最適閾値判定部3015)
図32は最適閾値判定部3015の説明図である。
ここでの閾値は,ユニット行列Umの各領域に対応する入力画像の領域にユニットシンボルが埋め込まれているかどうかを判定するための閾値(Tsと呼ぶ)であり,フィルタ出力値行列の任意の要素の値が閾値Tsを超えたならば,入力画像のそれに対応する位置にはシンボルユニットが埋め込まれているものと判定する。最適閾値判定は以下のステップで行われる。
・ステップ1:フィルタ出力値行列の要素(信号検出フィルタの出力値)の平均Fa,標準偏差Fsなどから閾値tsの初期値を設定する(図32▲1▼)。ここでは例えば初期値をts=Fa−Fs*3とする。
・ステップ2:フィルタ出力値行列をtsによって二値化し,ユニット抽出画像を作成する(図32▲2▼)。
・ステップ3:ユニット抽出画像に対してユニット数記録単位行列を当てはめる(図32▲3▼)。
・ステップ4:ユニット抽出画像のユニット数記録単位行列の各要素に対応する領域中のシンボルユニット数を数え,ユニット数記録単位行列に記録する(図32▲4▼)。
・ステップ5:埋め込み信号数検出部3013で復号された記録用ユニット帯に記録されていたシンボルユニット数とステップ4から得られたシンボルユニット数の差分の絶対値をユニット数記録単位行列の要素毎に計算し,すべての要素についての合計値をSf(ts)とする(図32▲3▼)。
・ステップ6:Sf(ts)が最小となるtsをTsとして記録する(図32▲3▼)。
・ステップ7:tsにΔtを加え,tsを更新する(図32▲7▼)。Δtはあらかじめ定めた値か,ステップ1で求めた標準偏差Fs(例えばΔt=Fs×0.1とするなど)から算出しても良い。
・ステップ8:Tsが予定した値に達したならば終了する。そうでなければ,ステップ1に戻る(図32▲8▼)。
【0131】
(検出信号計数部3016)
図33は検出信号計数部3016の説明図である。
この部分の処理は最適閾値判定部3015から得られた最適閾値Tsによってフィルタ出力値行列を二値化したユニット抽出画像を用いて,最適閾値判定部3015とほぼ同一の処理を行う。
・ステップ1:フィルタ出力値行列をTsによって二値化し,ユニット抽出画像を作成する(図33▲1▼)。
・ステップ2:ユニット抽出画像に対してユニット数記録単位行列を当てはめる(図33▲2▼)。
・ステップ3:ユニット抽出画像のユニット数記録単位行列の各要素に対応する領域中のシンボルユニット数を数え,ユニット数記録単位行列に記録する(図33▲3▼)。
・ステップ4:埋め込み信号数検出部3013で復号された記録用ユニット帯に記録されていたシンボルユニット数とステップ3から得られたシンボルユニット数の差分D(X,Y)をユニット数記録単位行列の要素毎に計算する(図33▲4▼)。ユニット数記録単位行列の任意の要素Nu(X,Y)におけるD(X,Y)は,記録用ユニット帯から復元されたユニットシンボル数をR(X,Y),ステップ3で計測されたユニットシンボル数をC(X,Y)としてD(X,Y)=R(X,Y)−c(X,Y)によって計算されるものとする。
【0132】
(改ざん判定部3017)
ユニット数記録単位の任意の要素N(X,Y)における改ざんの判定はD(X,Y)を用いて以下のように行う。
(1)文字が追加された改ざん:D(X,Y)>TA(TAは正の整数)「記録されていたユニットシンボル数より検出されたユニットシンボル数の方が少ない場合には,本来埋め込まれていたユニットシンボルの上に文字が追加されたために検出不能になったと判断。」
(2)文字が消去された改ざん:D(X,Y)<TC(TCは負の整数)「記録されていたユニットシンボル数より検出されたユニットシンボル数の方が多い場合には,本来埋め込まれていなかったユニットシンボルが検出された。これは文字を修正液などで消去した後に,画像に文字領域ではない汚れが生じ,これに信号検出フィルタが反応したものと判断。第2の実施の形態で検出できなかった文字消去による改ざんを検出するため。」
(3)改ざんなし:(1),(2)以外
【0133】
以上説明したように,本実施の形態によれば,以下の効果が得られる。
(f)文書画像をいくつかのブロックに分割し,各ブロック内に埋め込んだシンボルユニット数を記録することで,ブロック単位で改ざん検出を行うことができ,改ざん場所の特定が可能となる。
(g)埋め込んだ信号数を記録することで,信号検出や改ざん検出のための最適な閾値を求めることができる。
(h)印刷された文書に対し,空白部分に文字列を追加したり,任意の文字列を修正液などで消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
【0134】
以上,添付図面を参照しながら本発明にかかる電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出方法の好適な実施形態について説明したが,本発明はかかる例に限定されない。当業者であれば,特許請求の範囲に記載された技術的思想の範疇内において各種の変更例または修正例に想到し得ることは明らかであり,それらについても当然に本発明の技術的範囲に属するものと了解される。
【0135】
例えば,第3の実施の形態の処理のあとに第1の実施の形態の処理を行い,最適閾値判定部3015で得られた最適閾値Tsを第1の実施の形態のステップS1203およびステップS1204の処理(図18)の閾値Tsとして用いても良い。これによりTsを固定値とした場合よりも埋め込み情報の抽出の精度が向上する。
【0136】
同様に第3の実施の形態の処理のあとに第2の実施の形態の処理を行い,最適閾値判定部3015で得られた最適閾値Tsを第2の実施の形態の閾値Tsとして用いることも可能である。これによりTsを固定値とした場合よりも改ざん検出の精度が向上する。
【0137】
【発明の効果】
以上説明したように,本発明の主要な効果を挙げれば以下の通りである。
(a)透かしを挿入する文書画像の文字の配置状態を参照し,文字に重ならない領域にのみ意味のある情報(符号語のシンボル)を埋め込むため,元の文書がどのようなものであっても確実に機密情報を埋め込むことができる。
(b)符号語のシンボルを埋め込まない領域には,相反する信号ユニットを同じ数だけ配置することにより,検出時にシンボルが埋め込まれていないことを確実に判定できる。
(c)埋め込み情報の検出時に,ある領域に対する2つのフィルタの出力値のそれぞれの総和などによりシンボルの判定を行うため,情報検出の精度が高く保たれる。
(d)埋め込んだ信号数などの属性情報をセットする属性記録領域を信号を埋め込む領域の4隅に設定することで,機密情報を検出する際に入出力デバイスのハードウェア的な誤差に影響されることなく正確に属性情報を取り出すことが可能となり,それ以降の検出精度を向上させることができる。
【0138】
さらに,上記発明の実施の形態で説明した応用例によれば,さらに,以下の効果を得ることができる。
(e)印刷された文書に対し,主に任意の文字列を修正液などで消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
(f)文書画像をいくつかのブロックに分割し,各ブロック内に埋め込んだシンボルユニット数を記録することで,ブロック単位で改ざん検出を行うことができ,改ざん場所の特定が可能となる。
(g)埋め込んだ信号数を記録することで,信号検出や改ざん検出のための最適な閾値を求めることができる。
(h)印刷された文書に対し,空白部分に文字列を追加したり,任意の文字列を修正液などで消去するような不正があった場合,その文書の原文がなくても改ざんが検出でき,改ざん場所も特定できる。
【図面の簡単な説明】
【図1】電子透かし埋め込み装置及び電子透かし検出装置の構成を示す説明図である。
【図2】信号ユニットの一例を示す説明図であり,(1)はユニットAを,(2)はユニットBを示している。
【図3】図2(1)の画素値の変化をarctan(1/3)の方向から見た断面図である。
【図4】信号ユニットの一例を示す説明図であり,(3)はユニットCを,(4)はユニットDを,(5)はユニットEを示している。
【図5】背景画像の説明図であり,(1)はユニットEを背景ユニットと定義し,これを隙間なく並べた透かし画像の背景とした場合を示し,(2)は(1)の背景画像の中にユニットAを埋め込んだ一例を示し,(3)は(1)の背景画像の中にユニットBを埋め込んだ一例を示している。
【図6】ユニットパターンの一例を示す説明図である。
【図7】透かし画像形成部1006の処理の流れを示す流れ図である。
【図8】シンボルユニット配置可否行列の一例を示す説明図である
【図9】ユニットパターン配置可否行列の一例を示す説明図である。
【図10】ユニットパターン行列の一例を示す説明図である。
【図11】ユニット行列の一例を示す説明図である。
【図12】属性記録領域の説明図である。
【図13】ステップS1107の一例を示す説明図である。
【図14】透かし検出部1011の処理の流れを示す説明図である。
【図15】信号領域の検出方法の説明図である。
【図16】属性領域に埋め込まれたユニット行列の大きさを復元する方法の一例を示す説明図である。
【図17】ステップS1203とステップS1204の説明図である。
【図18】ステップS1203とステップS1204を実現する別の方法の説明図である。
【図19】ユニットパターン行列から符号語を取り出す方法の一例を示す説明図である。
【図20】本発明の第2の実施の形態の構成を示す図である。
【図21】文字消去改ざん検出部の動作を示す流れ図である。
【図22】文字領域抽出画像の説明図である。
【図23】ステップS2102の説明図である。
【図24】ステップS2103の説明図である。
【図25】改ざんがあった場合の説明図である。
【図26】本発明の第3の実施の形態の構成を示す説明図である。
【図27】埋め込み信号数記録部3012の動作を示す流れ図である。
【図28】ステップS3101の説明図である。
【図29】ステップS3102およびステップS3103の説明図である。
【図30】埋め込み信号数検出部3013の説明図である。
【図31】フィル列出力値算出部3014の説明図である。
【図32】最適閾値判定部3015の説明図である。
【図33】検出信号計数部3016の説明図である。
【符号の説明】
1001,2001,3001 電子透かし埋め込み装置
1002,2002,3002 電子透かし検出装置
1003,2003,3003 文書データ
1004,2004,3004 機密情報
1005,2005,3005 文書画像形成部
1006,2006,3006 透かし画像形成部
1007,2007,3007 透かし入り文書画像合成部
1008,2008,3008 出力デバイス
1009,2009,3009 印刷文書(紙)
1010,2010,3010 入力デバイス
1011,2011 透かし検出部
2012 文字消去改ざん検出部
3012 埋め込み信号記録部
3013 埋め込み信号数検出部
3014 フィルタ出力値算出部
3015 最適閾値判定部
3016 検出信号数計数部
3017 改ざん判定部
[0001]
BACKGROUND OF THE INVENTION
In the present invention, when a character string is added to or deleted from a watermarked document that has already been printed, the document is scanned with a scanner or the like. Pi The present invention relates to a digital watermark embedding / detection technique for specifying whether or not there is a change from the original and performing processing by inputting it to a computer.
[0002]
[Prior art]
“Digital watermarking” that embeds information to prevent copying / counterfeiting and confidential information in images and document data in a form that is invisible to the human eye is based on the premise that all storage and data transfer are performed on electronic media. Since the information embedded by the watermark is not deteriorated or lost, the information can be reliably detected. Similarly, documents printed on paper media cannot be easily tampered with in a form that is not visually unsightly other than text to prevent unauthorized tampering and copying. There is a need for a method for embedding confidential information in a print document.
[0003]
The following techniques are known as digital watermark embedding methods for black and white binary documents that are most widely used as printed materials.
[0004]
[1] Japanese Patent Laid-Open No. 9-179494 “Confidential Information Recording Method”
Assume that printing is performed with a printer of 400 dpi or more. Information is digitized and information is expressed by the distance (number of dots) between the reference point mark and the position determination mark.
[0005]
[2] Japanese Patent Application Laid-Open No. 2001-78006 “Method and apparatus for embedding / detecting watermark information in a monochrome binary document image”
A minimum rectangle surrounding an arbitrary character string is divided into several blocks and divided into two groups (group 1 and group 2) (the number of groups may be three or more). For example, when the signal is 1, the feature amount in the block of group 1 is increased and the feature amount in each block of group 2 is decreased. When the signal is 0, the reverse operation is performed. The feature amount in the block includes the number of pixels in the character area, the thickness of the character, and the distance to the point where the block first hits the character area.
[0006]
[3] JP 2001-53954 A "Information embedding device, information reading device, digital watermark system, information embedding method, information reading method and recording medium"
The width and height of the minimum rectangle that encloses one character are defined as the feature amount for the character, and the symbol is represented by a classification pattern of the magnitude relationship of the feature amount between two or more characters. For example, six feature quantities can be defined from three characters, and combinations of patterns of these magnitude relations are listed, these combinations are classified into two groups, and a symbol is given to each. If the information to be embedded is symbol 0 and the combination pattern of the feature values of the character selected to represent this is symbol 1, the character region is expanded by expanding one of the six feature values. Change. The pattern to be changed is selected so that the amount of change is minimized.
[0007]
[4] Japanese Patent Application No. 10-200743 “Document Processing Device”
Information is expressed by whether or not the screen lines of the line screen (special screen composed of fine parallel lines) are moved backward.
[0008]
[Problems to be solved by the invention]
By the way, when a change such as overwriting or erasure of characters is performed on a printed document, it is necessary to compare it with the original in order to know the changed part. When changes are made by handwriting or the like, they can be easily identified because they are different from the printed characters. However, when overwriting is performed with the same font, it is difficult to distinguish the changed portions. In the conventional examples [1] to [4], there is a method for determining whether or not the information embedded in the printed document cannot be read correctly. The detection accuracy is not high because the information cannot be read even if it is done.
[0009]
The present invention has been made in view of the above-mentioned problems of the conventional digital watermark embedding / detection technology, and an object of the present invention is new and improved capable of improving the detection accuracy of confidential information. An electronic watermark embedding device, an electronic watermark detection device, an electronic watermark embedding method, and an electronic watermark detection method are provided.
[0010]
[Means for Solving the Problems]
In order to solve the above problems, according to a first aspect of the present invention, there is provided a digital watermark embedding apparatus that embeds confidential information in a document image with a digital watermark. The digital watermark embedding device (1001) of the present invention includes a watermark image forming unit (1006) that creates a watermark image based on the confidential information (1004) with reference to the document image, and the watermark image forming unit (1006) 1006) calculates an embedding area for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter in the document image, and whether the ratio of the character area to the embedding area is equal to or less than a predetermined threshold value. A dot pattern (symbol) that can identify a symbol that forms at least a part of the confidential information in an area that does not overlap with the character area of the embedding area when the ratio of the character area is equal to or less than a predetermined threshold. Embed a certain number of units) Characteristic And
[0011]
Further, the watermark image forming unit (1006) embeds a plurality of types and a predetermined number of the symbol units in a region that does not overlap the character region in the embedding region where the ratio of the character region exceeds a predetermined threshold. Characteristic And
[0012]
Further, the watermark image forming unit (1006) embeds a dot pattern (background unit) which is a symbol unrelated to the confidential information in an area overlapping the character area of the embedding area. Characteristic And
[0013]
In order to solve the above problem, according to a second aspect of the present invention, there is provided a digital watermark detection apparatus for detecting confidential information embedded in a document image by a digital watermark. In the digital watermark detection apparatus (1002) of the present invention, the document image is divided into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter. The confidential information is embedded by embedding a dot pattern (symbol unit) that can identify a symbol that forms at least a part of information, or a dot pattern (background unit) that is a symbol unrelated to the confidential information. Yes.
[0014]
And a watermark detection unit (1011) for detecting the confidential information, wherein the watermark detection unit includes a plurality of types of filters that can identify a predetermined symbol from the dot pattern, and each of the embedding areas includes the plurality of filters. Matching is performed using different types of filters, and at least one of the confidential information corresponding to the one filter from the embedded region in which the number of matching of one filter is very large compared to the number of matching of all the other filters. Part is detected.
[0015]
The watermark detection unit may not detect the confidential information from the embedding area where there is no difference between the matching numbers of the filters.
[0016]
In order to solve the above problem, according to a third aspect of the present invention, there is provided a digital watermark embedding method for embedding confidential information in a document image by digital watermark. The digital watermark embedding method of the present invention includes the following first to fifth steps.
(1) A first step of dividing the document image into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter.
(2) A second step of determining, for each of the embedding areas, whether or not the character area ratio is equal to or less than a predetermined threshold value.
(3) A dot pattern (symbol unit) that can identify a symbol that forms at least a part of the confidential information in an area that does not overlap the character area of the embedded area when the ratio of the character area is equal to or less than a predetermined threshold. A third step of embedding a predetermined number.
(4) A fourth step of embedding a plurality of types and a predetermined number of the symbol units in an area that does not overlap the character area in the embedding area where the ratio of the character area exceeds a predetermined threshold.
(5) A fifth step of embedding a dot pattern (background unit), which is a symbol unrelated to the confidential information, in an area overlapping the character area of the embedding area.
[0017]
In order to solve the above problems, according to a fourth aspect of the present invention, there is provided a digital watermark detection method for detecting confidential information embedded in a document image with a digital watermark. In the electronic watermark detection method of the present invention, the document image is divided into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter, and each embedded area includes at least the confidential information. The confidential information is embedded by embedding a dot pattern (symbol unit) that can identify a part of the symbol or a dot pattern (background unit) that is a symbol unrelated to the confidential information.
[0018]
Then, for each of the embedded regions, matching is performed using a plurality of types of filters. From the embedded region, the number of matching of one filter is much larger than the number of matching of all the other filters. It is characterized in that at least a part of the confidential information corresponding to the filter is detected, and the confidential information is not detected from the embedded area where there is no difference between the matching numbers of the filters.
[0019]
According to the digital watermark embedding device, the digital watermark detection device, the digital watermark embedding method, and the digital watermark detection device, the following effects can be obtained.
(A) By referring to the character arrangement state of the document image into which the electronic watermark is inserted and embedding a valid symbol unit that forms a part of confidential information only in an area other than the character area, what kind of original document is Confidential information can be embedded without fail.
(B) By embedding a predetermined number of symbol units in a region where symbol units are not embedded, it is possible to reliably determine that a valid symbol unit forming part of confidential information is not embedded at the time of detection. it can.
(C) When detecting embedded information, symbols are determined based on the sum of output values of a plurality of types of filters for a certain area, so that the accuracy of information detection is kept high.
[0020]
Further, it is preferable that the watermarked document image composition unit records various attribute information at the time of embedding and / or detecting the confidential information at four corners of the watermarked document image. According to this configuration, the following effects can be obtained.
(D) By setting the attribute recording areas for setting the attribute information such as the number of embedded signals at the four corners of the signal embedding area, it is affected by hardware errors of the input / output device when detecting confidential information. Therefore, it is possible to accurately extract the attribute information without increasing the detection accuracy thereafter.
[0021]
Furthermore, in the digital watermark detection apparatus, it is possible to add a function for performing falsification detection. That is, another digital watermark detection apparatus (2001) of the present invention further includes a character erasure / alteration detection unit (2012), and the character erasure / alteration detection unit detects a document image in which the confidential information is embedded with a predetermined threshold. By binarizing, a character area extraction image is created with the pixel value of the character area set to 0 and the pixel value of the background area set to 1, and the symbol unit of the document image in which the confidential information is embedded cannot be detected. By creating a symbol unit extracted image with a pixel value of 0 and a pixel value of a region where the symbol unit can be detected as 1, and comparing the character region extracted image with the symbol unit extracted image (by generating a difference image) , Detecting alteration of the watermarked document image. According to such a configuration, the following effects can be further obtained.
(E) If there is a fraud that erases an arbitrary character string in a printed document, it is possible to detect falsification even if there is no original text of the document, and to specify the falsification location.
[0022]
Furthermore, in the digital watermark detection apparatus, it is possible to add a function for performing falsification detection by inserting additional information for falsification detection together with confidential information. That is, another digital watermark detection apparatus (3001) of the present invention detects the number of the symbol units embedded when the confidential information is embedded in the document image, the embedded signal number detection unit (3013), and the input The filter output value calculation unit (3014), the detection value of the embedded signal number detection unit, and the calculation of the filter output value calculation unit that calculate the output value of the predetermined filter for the image and record it for each embedding area And an optimum threshold value determination unit (3015) for calculating an optimum threshold value for detecting the number of the symbol units embedded in the watermark image from the value, and the actual value embedded in the watermarked document image. A detection signal counting unit (3016) for detecting the number of symbol units, a detection value of the embedded signal number detection unit, and the signal detector By comparing the count value of the part, it determines the presence or absence of tampering with the watermarked document image, and tampering judgment unit (3017), and further comprising a.
[0023]
According to such a configuration, the following effects can be further obtained.
(F) By dividing the document image into several blocks and recording the number of symbol units embedded in each block, alteration detection can be performed in units of blocks, and the alteration location can be specified.
(G) By recording the number of embedded signals, it is possible to obtain an optimum threshold for signal detection and tamper detection.
(H) If a printed document contains an illegal character such as adding a character string to a blank area or erasing an arbitrary character string with correction fluid, the alteration is detected without the original document. And tampering locations can be identified.
[0024]
DETAILED DESCRIPTION OF THE INVENTION
Exemplary embodiments of a digital watermark embedding device, a digital watermark detection device, a digital watermark embedding method, and a digital watermark detection method according to the present invention will be described below in detail with reference to the accompanying drawings. In the present specification and drawings, components having substantially the same functional configuration are denoted by the same reference numerals, and redundant description is omitted.
[0025]
(First embodiment)
FIG. 1 is an explanatory diagram showing the configuration of the digital watermark embedding device and the digital watermark detection device according to the first embodiment of the present invention. First, the digital watermark embedding device 1001 will be described.
[0026]
(Digital watermark embedding apparatus 1001)
An electronic watermark embedding device 1001 is a device that forms a document image based on document data 1003 and confidential information 1004 embedded in the document, and prints it on a paper medium. The document data 1003 is data including font information and layout information, and is data created by a document creation tool such as word processing software. The confidential information 1004 is information embedded in a paper medium in a format other than characters, and is various data such as characters, images, and sounds.
[0027]
As shown in FIG. 1, the digital watermark embedding apparatus 1001 includes a document image forming unit 1005, a watermark image forming unit 1006, a watermarked document image synthesizing unit 1007, and an output device 1008.
[0028]
(Document Image Forming Unit 1005)
The document image forming unit 1005 creates an image in a state where the document data 1003 is printed on a paper surface. Specifically, the white pixel region in the document image is a portion where nothing is printed, and the black pixel region is a portion where black paint is applied. In this embodiment, the description will be made on the assumption that printing is performed on white paper with black ink (single color). However, the present invention is not limited to this, and printing is performed in color (multicolor). However, the present invention can be similarly applied.
[0029]
(Watermark image forming unit 1006)
The watermark image forming unit 1006 digitizes the confidential information 1004 and converts it into a numerical value, and performs N-ary encoding (N is a natural number of 2 or more. The encoded bit string is referred to as a “code word”). Each symbol of the word is assigned to a watermark signal prepared in advance. This embodiment is characterized by the watermark embedding operation by the watermark image forming unit 1006. In other words, the watermark image forming unit 1006 refers to the document data 1003 when embedding the confidential information 1004 in the document data 1003, thereby reliably embedding the confidential information 1004 whatever the document data 1003 is. be able to. The watermark signal and its embedding operation will be described later.
[0030]
(Watermarked document image composition unit 1007, output device 1008)
The watermarked document image composition unit 1007 creates a watermarked document image by superimposing the document image and the watermark image. The output device 1008 is an output device such as a printer, and prints a watermarked document image on a paper medium. Therefore, the document image forming unit 1005, the watermark image forming unit 1006, and the watermarked document image synthesizing unit 1007 may be realized as one function in the printer driver.
[0031]
The print document 1009 is printed by embedding confidential information 1004 in the original document data 1003, and is physically stored and managed.
[0032]
The digital watermark embedding apparatus 1001 is configured as described above.
Next, a watermark signal used when the watermark image forming unit 1006 embeds confidential information 1004 in the document data 1003 will be described.
[0033]
(Signal unit)
The watermark signal represents a wave having an arbitrary wavelength and direction by an arrangement of dots (black pixels). Hereinafter, a rectangle having a width and a height of Sw and Sh is referred to as a “signal unit” as one signal unit. FIG. 2 is an explanatory diagram showing an example of the signal unit.
[0034]
Although the width Sw and the height Sh may be different, in the present embodiment, Sw = Sh is set for ease of explanation. The unit of length is the number of pixels. In the example of FIG. 2, Sw = Sh = 12. The size when these signals are printed on the paper surface depends on the resolution of the watermark image. For example, the watermark image is an image of 600 dpi (dot per inch: unit of resolution, number of dots per inch). 2, the width and height of the signal unit in FIG. 2 is 12/600 = 0.02 (inch) on the printed document.
[0035]
In FIG. 2A, the distance between dots is dense in the direction of arctan (3) (arctan is an inverse function of tan) with respect to the horizontal axis, and the wave propagation direction is arctan (−1/3). . Hereinafter, this signal unit is referred to as unit A. In FIG. 2B, the distance between dots is dense in the direction of arctan (−3) with respect to the horizontal axis, and the wave propagation direction is arctan (1/3). Hereinafter, this signal unit is referred to as unit B.
[0036]
FIG. 3 is a cross-sectional view of the change in the pixel value in FIG. 2A as viewed from the direction of arctan (1/3). In FIG. 3, the portion where the dots are arranged is the antinode of the minimum value of the wave (the point where the amplitude is maximum), and the portion where the dots are not arranged is the antinode of the maximum value of the wave.
[0037]
In addition, since there are two regions in each unit where dots are densely arranged, the frequency per unit is 2 in this example. Since the wave propagation direction is perpendicular to the direction in which the dots are densely arranged, the wave of unit A is arctan (-1/3) with respect to the horizontal direction, and the wave of unit B is arctan (1/3). Become. Note that a × b = −1 when the direction of arctan (a) and the direction of actan (b) are perpendicular.
[0038]
In addition to the signal units shown in FIGS. 2 (1) and (2), for example, dot arrangements as shown in FIGS. 4 (3) to (5) are conceivable. In FIG. 4C, the distance between the dots is dense in the direction of arctan (1/3) with respect to the horizontal axis, and the wave propagation direction is arctan (−3). Hereinafter, this signal unit is referred to as unit C.
In FIG. 4 (4), the distance between dots is dense in the direction of arctan (−1/3) with respect to the horizontal axis, and the wave propagation direction is arctan (3). Hereinafter, this signal unit is referred to as unit D. In FIG. 4 (5), the distance between dots is dense in the direction of arctan (1) with respect to the horizontal axis, and the wave propagation direction is arctan (−1). In FIG. 4 (5), it can be considered that the distance between the dots is dense in the direction of arctan (−1) with respect to the horizontal axis, and the wave propagation direction is arctan (1). Hereinafter, this signal unit is referred to as unit E.
[0039]
(Symbol unit)
By assigning codeword symbols to the signal unit and embedding the signal unit in the watermark image, the confidential information 1004 can be embedded in the watermark image. Hereinafter, a signal unit to which a codeword symbol is assigned is referred to as a “symbol unit”.
[0040]
The number of required symbol units is determined by the number of dimensions when the confidential information 1004 is converted into a code word. When the confidential information is subjected to binary encoding (N = 2), two types of symbol units (for example, unit A and unit B) are prepared. For example, symbol 0 is assigned to unit A and symbol 1 is assigned to unit B. Can be assigned. When the confidential information is quaternary encoded (N = 4), four types of symbol units (for example, unit A, unit B, unit C, unit D) are prepared. For example, symbol 0 is assigned to unit A. , Symbol 1 can be assigned to unit B, symbol 2 can be assigned to unit C, and symbol 3 can be assigned to unit D.
[0041]
(Background unit)
Further, for example, a symbol irrelevant to the codeword symbol (for example, symbol N in the case of N-way encoding of a confidential word) is assigned to the unit E, this is defined as a background unit, and this is arranged without any gaps. Can be the background. Hereinafter, a signal unit to which a symbol unrelated to the codeword symbol is assigned is referred to as a “background unit”. When arranging background units without gaps and embedding symbol units therein, the background unit at the position to be embedded is replaced with the symbol unit to be embedded.
[0042]
FIG. 5 (1) is an explanatory diagram showing a case where the unit E is defined as a background unit and arranged as a background of a watermark image without gaps. FIG. 5 (2) shows an example in which the unit A as a symbol unit is embedded in the background image of FIG. 5 (1), and FIG. 5 (3) shows the symbol unit in the background image of FIG. 5 (1). An example in which the unit B is embedded is shown.
[0043]
In the example shown in FIG. 5, since the number of dots in each signal unit is all equal, by arranging these signal units without gaps, the apparent density of the watermark image becomes uniform. Therefore, it appears that a gray image having a single density is embedded as a background on the printed paper. There are an infinite number of combinations of symbol assignments for signal units. In this way, it is possible to prevent a third party (illegal person) from easily deciphering the watermark signal.
[0044]
(Unit pattern)
It is also possible to embed the confidential information 1004 in the watermark image by simply arranging the corresponding symbol unit for each symbol of the codeword obtained by encoding the confidential information 1004. In the present embodiment, in order to further prevent unauthorized decoding by a third party, a signal unit arrangement pattern (hereinafter referred to as a unit pattern) is defined for each symbol of a code word, and the unit pattern is defined as a unit pattern. A method of embedding the confidential information 1004 in the watermark image by arranging the images will be described. The concept of the unit pattern will be described with reference to FIG.
[0045]
FIG. 6 shows an example of a unit pattern employed in the present embodiment and symbols represented by the unit pattern. Here, one unit pattern is a matrix of signal units of width (column) × height (row) = 4 × 2. Also, the background unit is unit E (symbol 2), and the symbol units embedded therein are unit A (symbol 0) and unit B (symbol 1).
In FIG. 6 (1), unit A (symbol 0) is arranged at a predetermined threshold (for example, 6) or more, and symbol 0 is represented as an entire unit pattern.
In FIG. 6 (2), unit B (symbol 1) is arranged at a predetermined threshold (for example, 6) or more, and symbol 1 is represented as an entire unit pattern.
In FIG. 6 (3), the unit A and the unit B are arranged in substantially the same number (the same number or one of the symbol units is more than one), and the symbol 2 is represented as a whole unit pattern.
[0046]
The configuration of the digital watermark embedding apparatus 1001 and the watermark signal have been described above. Next, the operation of the digital watermark embedding apparatus 1001 will be described with reference to FIGS.
[0047]
First, the document image forming unit 1005 creates, for each page, an image in which the document is printed on paper based on the document data 1003. This document image will be described as a monochrome binary image. In the following description, a “character area” of a document image is an area to which ink (toner) is applied when printed by a printer, and is a pixel having a luminance value of 0 (black pixel) on the document image. The “background region” is a region where ink (toner) is not applied when printing with a printer, and indicates a pixel (white pixel) having a luminance value of 1 in the document image.
[0048]
The watermark image forming unit 1006 creates a watermark image to be superimposed as a background of the document image from the confidential information 1004. The operation of the watermark image forming unit 1006 will be described below with reference to FIG. FIG. 7 is an explanatory diagram showing a processing flow of the watermark image forming unit 1006.
[0049]
(Step S1101)
In step S1101, the confidential information 1004 is converted into an N-element code. N is arbitrary, but in the following, for simplicity, it is assumed that N = 2 (the confidential information 1004 is converted into a binary code). Accordingly, the code word generated in step S1101 is represented by a bit string of 0 and 1. In step S1101, the confidential information 1004 may be encoded as it is, or the encrypted information may be encoded.
[0050]
(Step S1102)
In step S1102, a unit pattern is assigned to each symbol of the code word as shown in FIG.
[0051]
(Step S1103)
In step S1103, a symbol unit arrangement availability matrix is defined. The symbol unit arrangement availability matrix represents an image obtained by dividing a document image into block images having a block size of Sw (width) × Sh (height) pixels, and the corresponding block of the document image. Indicates whether a symbol unit can be embedded. This is a matrix for designating a place where a symbol unit can be embedded in advance because it cannot be detected when a symbol unit is inserted in the character area. If the value of the matrix element is 1, the symbol unit can be embedded in the corresponding block of the document image, and if the value is 0, the background unit is embedded. Here, Sw and Sh are the width and height of the signal unit, respectively. If the size of the input document image is W × H, the number of elements of the unit matrix Um is
Width (column) x height (row) = Mw x Mh = W / Sw x H / Sh
It becomes.
[0052]
Each element of the symbol unit arrangement availability matrix is determined by whether or not a character area exists in the corresponding block of the document image. For example, arbitrary elements (X, Y) (Y rows and X columns) of the symbol unit arrangement availability matrix are x = X × Sw to (X + 1) × Sw, y = Y × Sh to (Y + 1) × Sh of the input document image. If the character area (pixels with a luminance value of 0) included in the is less than or equal to Tn pixels, 1 is assumed, and if the character area is larger than Tn pixels, 0 is assumed. Tn is a threshold and is a small number of Sw × Sh × 0.5 or less.
[0053]
FIG. 8 shows an example of creating a symbol unit arrangement availability matrix. FIG. 8A shows the blocks corresponding to the elements of the symbol unit arrangement availability matrix superimposed on the input document image. FIG. 8B shows that the value of the corresponding block is set to 0 when each block includes a character area. In FIG. 8 (3), the value of each element of the symbol unit arrangement availability matrix is determined from the character area determination result.
[0054]
(Step S1104)
In step S1104, a unit pattern arrangement availability matrix is created. The element value is 1 when the unit pattern can be inserted into the region corresponding to this matrix in the document image, and 0 when the unit pattern cannot be inserted. If a unit pattern is defined as a matrix of signal units of width (columns) × height (rows) = 4 × 2, determination of whether or not a unit pattern can be inserted is performed as follows. First, the symbol unit arrangement availability matrix shown in FIG. 8 (3) is divided into 4 × 2 regions. Of the eight signal units constituting one area, if a predetermined threshold value Tu (Tu is about 6) or more can be embedded in a symbol unit (the value of the symbol unit arrangement availability matrix is 1), the unit pattern can be embedded. In other cases, the unit pattern cannot be embedded.
[0055]
FIG. 9 is a diagram for explaining an example of the process of creating the unit pattern arrangement availability matrix. FIG. 9 (1) shows that one unit pattern is composed of eight signal units. In FIG. 9B, for each unit pattern, 1 is assigned to a unit pattern in which the number of elements of the corresponding symbol unit arrangement availability matrix being 1 is Tu (= 6) or more, and 0 is assigned to the other unit patterns. It shows that it is given. FIG. 9 (3) shows that the value of each element of the unit pattern arrangement availability matrix is set.
[0056]
(Step S1105)
In step S1105, a unit pattern matrix is created with reference to the unit pattern arrangement availability matrix. The codeword symbol is repeatedly set in the unit pattern matrix, but is not set in an element in which the unit pattern cannot be embedded. For example, as shown in FIG. 10, it is assumed that the size of the unit pattern matrix and the unit pattern arrangement availability matrix is Pw × Ph = 4 × 4, and the codeword symbol is 4 bits of (0011). In this figure, since the value of the element in the first row and second column of the unit pattern arrangement matrix is 0, the second bit (symbol 0) of the codeword symbol is not set, but the symbol 2 is set and the first row The second bit of the symbol of the code word is set in the third column.
[0057]
(Step S1106)
In step S1106, a unit matrix Um is created based on the unit pattern matrix and the symbol unit arrangement availability matrix. The unit matrix Um is the same size as the symbol unit arrangement availability matrix and describes the arrangement pattern of signal units. The rules for the arrangement of signal units are defined as follows.
[0058]
Step 1: A background unit (symbol 2) is set at a position where the element is 0 in the symbol unit arrangement availability matrix (FIG. 11 (1)).
Step 2: If the element of the unit pattern matrix is a codeword symbol, the symbol unit corresponding to the symbol is set in the corresponding region of the unit matrix Um (FIG. 11 (2)).
Step 3: If the unit pattern matrix is not a codeword symbol (the unit pattern arrangement availability matrix has a value of 0), the same number of symbol units representing 0 and symbol units representing 1 are set (FIG. 11 ( 3)).
Step 4: A background unit is set in an area where no signal unit is set (FIG. 11 (4)).
[0059]
In summary, a background symbol is set in the character area, and if the background area of the arbitrary unit pattern is Tu (= 6) or more, a codeword symbol is assigned. Otherwise, two types of symbols are assigned to the background area. Assign the same number of units. If the background area is odd, a background symbol is set for the remaining one. As a result, since the unit pattern to which the codeword symbol is assigned has six or more identical unit patterns, the total output value of the filter for the embedded symbol unit at the time of detection is the same as that of the other filter. The unit pattern to which the code word symbol is not allocated becomes much smaller than the total output value, and the difference between the total output values of the two filters is small. Therefore, it is easy to determine whether the code pattern is a unit pattern assigned or not assigned.
[0060]
(Recording embedding conditions)
The size of the signal unit in the input image in the digital watermark detection apparatus 1002 can be calculated from the size of the signal unit set in the digital watermark embedding apparatus 1001 and the ratio between the resolution of the output device and the resolution of the input device.
[0061]
For example,
The size of the signal unit embedded in the document by the digital watermark embedding apparatus 1001 is width × height = Sw × Sh (pixel).
The size of the signal unit in the input image of the digital watermark detection apparatus 1002 is Siw × Sih.
The resolution of the output device 1008 is Dout (dpi), and the resolution of the input device 1010 is Din (dpi).
Then,
Siw = Sw × Din / Dout
Sih = Sh × Din / Dout
It becomes.
[0062]
However, Siw and Sih do not necessarily have the above formulas due to mechanical accuracy errors of printers and scanners (Din and Dout are not as set). As a result, a shift occurs in the signal detection position in the input image of the digital watermark detection apparatus 1002, and the detection accuracy of the embedded confidential information 1004 decreases.
[0063]
For example, if Sw = Sh = 12, Dout = 600 and Din = 400, then Siw = Sih = 12 × 400/600 = 8, but Dout and Din contain errors, and Siw and Sih are 8. There are cases where this is not possible. Even if the Siw error is 0.1% (0.008 pixel error, actually a little larger), when A4 size paper is captured at a scanner resolution of 400 dpi, the size of the input image is approximately width x height. When the left edge of the image is used as a reference, the displacement at the right edge of the image is 3000 × 0.008 = 24 (pixels), which is a displacement of three signal units. Significantly affects accuracy.
[0064]
As a solution to this, the number of signal units to be embedded in the watermark image is set to a multiple of an arbitrarily large integer Ns, so that the error when calculating the size of the signal unit from the size of the signal embedding area of the input image is reduced. There is a method used for absorption. In the following, another method will be described.
[0065]
In the present embodiment, as shown in FIG. 12, the recording area (hereinafter referred to as the recording area) of the embedding conditions such as the number of signal units (the size of the unit matrix Um) in which the watermark image is embedded at the four corners of the unit matrix Um and the resolution of the printer. A method referred to as an attribute recording area) will be described. That is, as shown in FIG. 12A, when the size of the unit matrix Um (x, y) is x = 1 to Mw and y = 1 to Mh, Um (1, 1), Um (Mw , 1), Um (1, Mh), and the vicinity of Um (Mw, Mh) are used as attribute recording areas.
[0066]
FIG. 12B is an explanatory diagram of an example in which the unit matrix size is set in the attribute information recording unit of the unit matrix. Here, a method of expressing Mw and Mh by 16 bits and recording them in the attribute recording area 1 is shown. For example, when Mw = 400 is expressed by a binary number of 16 bits, it becomes “0000011100100000”. This is converted into a value of “1111111221121111” according to the unit matrix expression rule (step S1105). This is recorded in the unit matrices Um (2,1) to Um (17,1). Similarly, Mh = 600 is expressed by a binary number, converted to a unit matrix expression rule, and recorded in unit matrices Um (1,2) to Um (1,17).
[0067]
In the area Um (2, 2) to Um (17, 17) in FIG. 12 (2), other attributes such as the resolution of the printer may be recorded. In the digital watermark detection apparatus 1002, the size of the unit matrix is surely determined. Mw and Mh may be recorded repeatedly so that they can be detected. In addition, Um (1, 1) to Um (17, 17) are used as the attribute recording area 1 here, but to what range Um (1, 1) to Um (X, Y) is extended is an attribute. It varies depending on the amount of information to be recorded and the estimation of errors contained in Dout and Din. Further, the size of the attribute recording area is known, or the range of the attribute recording area is recorded in the attribute recording area itself, and the confidential information 1004 is not embedded in this area, and this area is ignored at the time of detection. To. Although the attribute recording area 1 has been described in FIG. 12B, the same applies to the attribute recording area 2 to the attribute recording area 4.
[0068]
The effect of setting the attribute information areas at the four corners of the unit image will be described in the description part of the digital watermark detection apparatus 1002 described later.
[0069]
(Step S1107)
FIG. 13 shows an example of step S1107. In step S1107, the signal units are arranged in the background image according to the unit matrix Um (FIG. 13 (1)) created in step S1106 (FIG. 13 (2)). The document image is superimposed on the background image created by arranging the signal units, and a watermarked document image is created (FIG. 13 (3)).
[0070]
The digital watermark embedding device 1001 has been described above. Next, the digital watermark detection apparatus 1002 will be described with reference to FIGS. 1 and 14 to 19.
[0071]
(Digital watermark detection apparatus 1002)
The digital watermark detection apparatus 1002 is an apparatus that takes in a document 1009 printed on a paper medium as an image and restores embedded confidential information 1004. As shown in FIG. 1, the digital watermark detection apparatus 1002 includes an input device 1010 and a watermark detection unit 1011.
[0072]
The input device 1010 is an input device such as a scanner, and captures a document 1009 printed on paper as a multi-value gray image in a computer. In addition, the watermark detection unit 1011 performs a filtering process on the input image and detects an embedded signal. The symbol is restored from the detected signal, and the embedded confidential information 1004 is taken out.
[0073]
The operation of the digital watermark detection apparatus 1002 configured as described above will be described with reference to FIGS.
[0074]
(Watermark Detection Unit 1011, Step S1201)
FIG. 14 shows a processing flow of the watermark detection unit 1011.
In step S1201, an image of a watermarked print document is input from the input device 1010.
[0075]
(Step S1202)
In step S1202, a contour line of a region in which the signal unit is embedded (hereinafter referred to as a signal region) is detected from the input image, and correction such as image rotation is performed.
[0076]
FIG. 15 is an explanatory diagram of a signal region detection method.
FIG. 15A shows the image input in step S1201. Here, an example in which the upper end of the signal area is detected is shown. Assume that the input image is Img (x, y), x = 0 to Wi-1, and y = 0 to Hi-1. Also, the size of the signal unit embedded in the document by the digital watermark embedding apparatus 1001 is width × height = Sw × Sh (pixel), the resolution of the output device 1008 is Dout (dpi), and the resolution of the input device 1010 is Din ( dpi)
tSw = SW × Din / Dout
tSh = Sh × Din / Dout
And That is, tSw and tSh are theoretical signal unit sizes in Img, and the signal detection filter is designed based on this value.
[0077]
A sample region S (x), x = 1 to Sn for detecting the upper end of the signal region is set from the image Img. Sn is assumed to be Wi / Np (Np is an integer of about 10 to 20). Further, the width of S (x) is Ws = tSw × Nt (Nt is an integer of about 2 to 5), the height is Hs = Hi / Nh (Nh is about 8), and the horizontal direction of S (x) in Img The position of is assumed to be x × Np.
[0078]
A method for detecting the upper end SY0 (n) of the signal region at an arbitrary S (n) will be described below.
Step 1: A region corresponding to S (n) is cut from Img (FIG. 15 (1)).
Step 2: Filter A and Filter B are applied to S (n), and the maximum value in the horizontal direction in S (n) is recorded in Fs (y) (FIG. 15 (2)).
Step 3: A certain threshold value Ty is set, and the average value of Fs (1) to Fs (Ty-1) is set to V0 (Ty), Fs (Ty) The average value of ~ Fs (Hs) is defined as V1 (Ty). Ty that maximizes V1 (Ty) −V0 (Ty) is set to SY0 (n) as the position of the upper end of the signal region in S (n) (FIG. 15 (3)).
[0079]
FIG. 15 (4) is a diagram showing a change in the value of Fs (y) with respect to y. As shown in the figure, in the area without the Img signal unit, the average value of the output value of the signal detection filter is small. On the other hand, the symbol unit (unit A or unit B) is densely arranged in the background portion by the document image output unit 1001. Therefore, the output value of the signal detection filter becomes large (the margin part of the document is the background part, which is also embedded densely here). Therefore, the output value of the signal detection filter greatly fluctuates around the boundary between the signal region and the other regions, and this is used for region detection.
[0080]
Steps 1 to 3 are performed for S (x), x = 1 to Sn to obtain SY0 (x), x = 1 to Sn. The upper end of the signal region is obtained by linearly approximating the sample points S0 (xNp, SY0 (x)) and x = 1 to Sn obtained by this using the least square method or the like. Other contour lines are also detected using the same method as described above. For example, an image obtained by rotating the signal area so that the upper end of the signal area is horizontal is referred to as an input image below.
[0081]
FIG. 16 shows an example of a method for restoring the size of the unit matrix embedded in the attribute area. Here, an example in which the signal area of the input image is (Ix0, Iy0) to (Ix1, Iy1) and information in the attribute recording area 1 is restored is shown.
Step 1: A region near (Ix0, Iy0) of the input image is cut out ((1) in FIG. 16).
Step 2: Set the attribute area 1 for the clipped area ((2) in FIG. 16). The attribute area 1 is assumed to be the same as that set in the document image output unit 1001. For example, when Mw is expressed by 16 bits, the most significant bit is (Ix0 + tSw, Iy0), and the least significant bit is (Ix0 + tSw × 17, Detected as being embedded in Iy0).
Step 3: Apply filter A and filter B to the Mw embedding area set in step 2, and the symbol unit corresponding to the larger output value of filter A and filter B at each bit position It is determined that it is embedded ((3) in FIG. 16).
Step 4: The value of Mw is restored in the reverse order as set by the document image output unit 1001 (FIG. 16 (4), (5)).
[0082]
Although the theoretical values tSw and tSh of the size of the signal unit in the input image include an error, the signal detection position in the attribute recording area is based on the boundary line detected in FIG. 15, for example, Sw = Sh = 12, Dout = 600, Din = 400, tSw = tSh = 12 × 400/600 = 8, so the attribute recording area is only about 8 × 17 = 136 pixels, and there is an error of 1 Even if it is about% (actually less than this), an error of about one pixel occurs at a position farthest from the reference point of the attribute area, and there is an effect that the signal detection position can be set almost accurately.
[0083]
The true width Siw of the signal unit in the input image is based on the width Mw of the unit matrix extracted from the attribute recording area and the width Ix1-Ix0 of the signal area obtained from FIG.
Siw = Mw / (Ix1-Ix0)
Can be calculated. Similarly, the true width Sih of the signal unit is
Sih = Mh / (Iy1-Iy0)
Can be calculated.
[0084]
(Steps S1203 and S1204)
FIG. 17 is an explanatory diagram of steps S1203 and S1204. In step S1203, the sum of the filter output values is calculated for each unit pattern. In FIG. 17, the convolution (convolution integration) with the filter A is calculated for each signal unit constituting the unit pattern U (x, y), and the sum of the output values of the convolution for each signal unit is filtered for the unit pattern. It is defined as an output value Fu (A, x, y) of A. However, the convolution for each signal unit is the maximum value calculated as the position of the filter A is shifted in the horizontal and vertical directions for each signal unit.
[0085]
Similarly, the output value Fu (B, x, y) for the unit pattern U (x, y) is calculated for the filter B.
[0086]
In step S1204, Fu (A, x, y) and Fu (B, x, y) are compared, and the absolute value | Fu (A, x, y) −Fu (B, x, y) | If it is smaller than a predetermined threshold value Tp, it is assumed that no codeword symbol is assigned. In other cases, it is determined that the larger symbol of Fu (A, x, y) and Fu (B, x, y) is assigned. That is, if Fu (A, x, y)> Fu (B, x, y), symbol 0 is embedded in U (x, y), and Fu (A, x, y) <Fu (B, x , Y), it is assumed that symbol 1 is embedded in U (x, y).
[0087]
FIG. 18 is an explanatory diagram of another method for realizing steps S1203 and S1204. In FIG. 18, the convolution with the filter A is calculated for each signal unit constituting the unit pattern U (x, y) as in FIG. At this time, a threshold Ts for symbol unit detection is determined, and if the convolution of the filter A for each signal unit is equal to or greater than Ts, it is determined that this signal is the symbol A. The number determined to be the symbol A in the unit pattern U (x, y) is defined as the output value Fu (A, x, y) of the filter A for the unit pattern U (x, y). However, the convolution for each signal unit is the maximum value calculated as the position of the filter A is shifted in the horizontal and vertical directions for each signal unit.
[0088]
Similarly, the output value Fu (B, x, y) for the unit pattern U (x, y) is calculated for the filter B.
[0089]
The processing in step S1204 is the same as that in FIG. 17 except that Fu (A, x, y) and Fu (B, x, y) are the number of signals detected in the unit pattern.
[0090]
The unit pattern matrix U is created by simultaneously performing the processing of FIG. 17 or FIG. 18 or the processing of FIG. 17 and FIG. 18 on all the unit patterns obtained from the input image.
[0091]
(Step S1205)
In step S1205, the embedded information is decoded based on the determined symbol. FIG. 19 shows an example of a method for extracting a code word from a unit pattern matrix. In FIG. 19, it is assumed that symbol 2 is set to an element to which no symbol is assigned, and the code word is restored by taking out the symbol while ignoring the element to which symbol 2 is set.
[0092]
As described above, according to the present embodiment, the following effects can be obtained.
(A) Referencing the character arrangement state of the document image into which the watermark is to be inserted, and embedding meaningful information (symbols of codewords) only in the area that does not overlap the character, so what the original document is Even confidential information can be embedded securely.
(B) By arranging the same number of conflicting signal units in the area where no symbol of the code word is embedded, it is possible to reliably determine that no symbol is embedded at the time of detection.
(C) When embedding information is detected, symbol determination is performed based on the sum of the output values of two filters for a certain area, so that the accuracy of information detection is kept high.
(D) By setting the attribute recording areas for setting the attribute information such as the number of embedded signals at the four corners of the signal embedding area, it is affected by hardware errors of the input / output device when detecting confidential information. Therefore, it is possible to accurately extract the attribute information without increasing the detection accuracy thereafter.
[0093]
(Second Embodiment)
FIG. 20 is an explanatory diagram showing the configuration of the digital watermark embedding device and the digital watermark detection device according to the second embodiment of the present invention. The difference from the first embodiment is that a character erasure / alteration detection unit 2012 is added to the digital watermark detection apparatus 2002. Here, it is assumed that the configuration and operation of the digital watermark embedding apparatus 1001 are the same as those in the first embodiment.
[0094]
(Character Erase / Falsification Detection Unit 2012)
The character erasure / alteration detection unit 2012 is a part that performs processing for detecting the presence / absence of alteration and the location of alteration when the print document 1009 is altered such as by erasing the character portion with a correction liquid.
[0095]
FIG. 21 is a flowchart showing the operation of the character erasure / alteration detection unit.
The alteration assumed here is a case where a part of the character portion of the printed document 1009 has been erased with a correction liquid or the like. The basic principle of falsification detection is as follows. The print document 1009 created by the digital watermark embedding apparatus 1001 includes
(1) The background unit is embedded in the character area, and the symbol unit is not embedded.
(2) Symbol units are densely embedded in the background area (area other than the character area).
There is a feature. For this reason, even if the character area (of the printed document) is deleted and the area is altered to the background area, it is difficult to embed a new symbol unit in that area. Despite this, it is used that the “region where the symbol unit is not embedded (illegal region)” appears.
[0096]
In the following description, an image obtained by performing correction such as rotation on an image input by the input device 1010 is referred to as an input image, as in the first embodiment.
Also,
The size of the signal unit embedded in the document by the digital watermark embedding apparatus 1001 is width × height = Sw × Sh (pixel).
The number of embedded signal units is horizontal × height = nw × nh.
-There are two types of embedded symbol units: Unit A and Unit B.
The size of the signal unit in the input image is Siw × Sih.
The explanation is based on the premise of
[0097]
Here, when the resolution of the output device is equal to the resolution of the input device, Siw = Sw and Sih = Sh. However, when the resolutions are different, Siw and Sih are calculated based on their ratio. For example, when the resolution of the output device is 600 dpi and the resolution of the input device is 400 dpi, Siw = Sw × 2/3 and Sih = Sh × 2/3.
[0098]
(Step S2101)
In step S2101, the character area is detected by binarizing the input image. In the image input by the input device, the character area has a small luminance value (color close to black) and the background area has a large luminance value (color close to white). Although the watermark signal is embedded in the entire surface of the printed document, the watermark signal has very few dots per unit area compared to the character area. The area can be separated. The binarization threshold may be determined in advance, or may be determined dynamically using an image processing method such as a discriminant analysis method from the distribution of luminance values of the input image.
[0099]
FIG. 22 is an explanatory diagram of a character area extraction image.
In the binarized image, the pixel value corresponding to the character area is set to 0, and the pixel value corresponding to the background area is set to 1. An image obtained by further reducing the image obtained by binarization to a size of nw × nh is referred to as a character region extracted image (FIG. 22). At the time of reduction, the value of one pixel is determined from the Siw × Sih pixel block of the binary image before reduction, but the pixel having a value of 0 among the Siw × Sih pixels of the binary image before reduction is a predetermined threshold value Tn. If it is above, the pixel value of the character area extraction image corresponding to it is set to 0. The threshold value Tn is set to a value of about Siw × Sih × 0.5.
[0100]
In step S2102, a unit matrix Um is generated from the input image and a symbol unit is detected to generate a unit extracted image.
[0101]
(Step S2102)
FIG. 23 is an explanatory diagram of step S2102. First, an input image is divided into nw × nh blocks (the size of one block is Siw × Sih) (FIG. 23 (2)), and a symbol unit is detected by a signal detection filter for each of the divided blocks.
[0102]
As in the description of FIG. 18, when the output value of either the signal detection filter A or B exceeds the threshold value Ts, it is determined that the symbol unit is embedded in the block. judge. Note that it is not necessary to distinguish which signal is embedded here. An image representing the result of detection of symbol units for all blocks is referred to as a unit extracted image (FIG. 23 (3)). The size of the unit extracted image is the same as the number of divided blocks and is Sw × Sh. In the unit extracted image of FIG. 23, it is assumed that the symbol unit is detected when the pixel size is white (pixel value is 1), and the symbol unit is not detected when the pixel is black (pixel value is 0). .
[0103]
(Step S2103)
In step S2103, the character region extraction image created in step S2101 is compared with the unit extraction image created in step S2102 to detect tampering. Since the symbol unit is not originally embedded in the portion that overlaps the character area of the input image, that is, the symbol unit is embedded only in the background portion, the symbol unit detection area (pixel value is 1) in the unit extracted image and the character area extracted image The background regions (pixel value is 1) in the same. Therefore, a difference image between the character region extracted image and the unit extracted image is generated, and a region where the value does not become zero is detected as “a portion where the print document (paper) has been tampered with by erasing the dictionary”.
[0104]
FIG. 24 is an explanatory diagram of step S2103. Since no alteration has been performed here, the value of all the pixels in the difference image is zero.
[0105]
FIG. 25 is an explanatory diagram when tampering occurs. Since the character area of the input image has been deleted and no character area is extracted from the area corresponding to that of the character area extraction image, the pixel value is 1 (FIG. 25 (3)). However, since no unit symbol is detected from the same area, the corresponding area of the unit extracted image has a pixel value of 0 ((6) in FIG. 25). Therefore, when these difference images are calculated, an area where the pixel value does not become 0 appears, and it can be specified that this is a falsification place (FIG. 25 (9)).
[0106]
Even if the character unit is very small and the symbol unit is embedded in the gap of one character, even if the character is erased with correction fluid and another character is overwritten, Since the symbol unit embedded in the gap is erased, this becomes undetectable. Therefore, if this is used, if there is an area in which the symbol unit cannot be detected at all in the unit extraction image, it may be possible that the area has been tampered with.
[0107]
The character region extraction image and the unit extraction image may be subjected to tampering detection after removing high-frequency components by performing noise removal or the like using an image processing method such as region enlargement / reduction. This makes it possible to perform stable tamper detection without being affected by noise components.
[0108]
As described above, according to the present embodiment, the following effects can be obtained.
(E) If there is a fraud in which an arbitrary character string is erased mainly with a correction liquid in a printed document, the alteration can be detected even if there is no original text of the document, and the alteration location can be specified.
[0109]
(Third embodiment)
FIG. 26 is a diagram showing the configuration of the third exemplary embodiment of the present invention. A difference from the first embodiment is that an embedded signal number recording unit 3012 is added to the digital watermark embedding device 3001, and an embedded signal number detection unit 3013, a filter output value calculation unit 3014, and an optimum threshold determination are added to the digital watermark detection device 3002. A part 3015, a detection signal counting part 3016, and a tampering determination part 3017 are added. Here, the operation of the other components is the same as that of the first embodiment.
[0110]
(Embedded signal number recording unit 3012)
The embedded signal number recording unit 3012 is a part that records the number of signals embedded in the watermark image in the watermark image itself. The number of signals varies depending on the number of characters and layout of the original document image.
[0111]
(Embedded signal number detection unit 3013)
The embedded signal number detection unit 3013 restores the numerical value recorded by the embedded signal number recording unit 3012 and extracts the number of signals embedded at the time of creating the watermark image.
[0112]
(Filter output value calculation unit 3014)
The filter output value calculation unit 3014 calculates the output value of the signal detection filter for the input image and records it for each signal embedding position.
[0113]
(Optimum threshold determination unit 3015)
The optimum threshold value determination unit 3015 calculates an optimum threshold value for signal detection using the output value calculated by the filter output value calculation unit 3014 and the number of embedded signals obtained by the embedded signal number detection unit 3013.
[0114]
(Detection signal counting unit 3016)
The detection signal counting unit 3016 counts the number of signals embedded in the input image using the threshold value obtained by the optimum threshold value determination unit 3015.
[0115]
(Falsification determination unit 3017)
The tampering determination unit 3017 determines whether tampering or the like has been performed by comparing the number of correct answers recorded by the embedded signal number detection unit 3013 with the number of signals obtained by the detection signal counting unit 3016, and specifies the tampering location. Do.
[0116]
(Embedded signal number recording unit 3012)
FIG. 27 is a flowchart showing the operation of the embedded signal number recording unit 3012.
[0117]
(Step S3101)
FIG. 28 is an explanatory diagram of step S3101. In step S3101, first, Iw elements at the left end of the unit matrix Um (FIG. 28 (2)) are used as recording units (called recording unit bands) for the number of embedded symbol units (FIG. 28 (3)). ). Next, the portion excluding the recording unit band of the unit matrix Um is divided into (horizontal × vertical =) Bw × Bh blocks (this is the unit number recording unit matrix Nu (x, y) x = 1 to Bw. , Y = 1 to Bh). The size of each block is bw × bh with the number of elements of the unit matrix Um as the unit of size (width × height =) bw × bh (FIG. 28 (4)).
[0118]
When the recording unit band is arranged at the left end of the unit matrix Um, parameters that can be set for the unit number recording unit matrix are the number of blocks in the horizontal direction and the size in the height direction of the blocks. The number of remaining vertical blocks and the size in the width direction of the blocks are automatically determined from the set parameters, the width of the recording unit band, and the parameters of the unit matrix Um.
[0119]
In the following description, when the size (number of elements) of the unit matrix Um is Mw × Mh, the number of blocks in the horizontal direction is Bw = 4, the size in the height direction of the blocks is bh = 16, and the recording unit band Let Iw = 4. Therefore, the number of blocks in the vertical direction is Bh = Mh / bh = Mh / 16, and the size in the width direction of the blocks is bw = (Mh−Iw) / Bw = (Mh−4) / 4.
[0120]
(Step S3102, Step S3103)
FIG. 29 is an explanatory diagram of steps S3102 and S3103. In step S3102, the number of symbol units included in the area corresponding to each element of the unit number recording unit matrix in the unit matrix Um is measured. The example of FIG. 29 shows a method of measuring the number of symbol units in the unit number recording unit matrix Nu (X, Y), which is executed by the following steps.
Step 1: An area on the unit matrix Um corresponding to Nu (X, Y) is extracted (FIG. 29 (1), (2)).
Step 2: The number of symbol units embedded in the area extracted in Step 1 is measured (FIG. 29 (3), (4)).
Here, it is assumed that the symbol unit embedding rule is that no symbol unit is embedded in the character area of the input document image in the same manner as described in the first embodiment. In the example of FIG. 29, it is assumed that the number of symbol units embedded in this area is 71.
[0121]
In step S3103, the number of symbol units measured in step S3102 is recorded in the recording unit band. The steps are shown below.
Step 3: N (X, Y) = 71 is expressed in binary (FIG. 29 (6)).
Step 4: Set the result of step 3 in the corresponding area of the recording unit band. (Fig. 29 (7), (8))
[0122]
In the example shown here, the number of rows bh of the unit matrix Um corresponding to one row of the unit number recording unit matrix is 16, and the width Iw of the unit band for recording is 4. Therefore, for each row of the unit number recording unit matrix, Thus, the number of recording units is Iw × bh = 4 × 16 = 64. Further, since the number of columns Bw of the unit number recording unit matrix is 4, the number of recording units assigned to one element of the unit number recording unit matrix (referred to as the unit recording unit number) is Iw × bh 侶 w = 64 / 4 = 8. Therefore, the first and second rows of the recording unit band corresponding to each row of the unit recording unit matrix have information on the first column of the unit recording unit matrix, and the third and fourth rows have the second column and 5 to 6 rows. The information in the third column is recorded in the eyes, and the information in the fourth column is recorded in the 7th to 8th rows by the number of unit recording units (8 bits).
[0123]
In this example, the number of units is recorded, but the ratio of the “number of symbol units” to the “maximum number of signal units that can be embedded in the area of the unit matrix Um corresponding to each element” of the unit recording unit matrix is It may be recorded. The method of recording the ratio is as follows: “The range of the unit matrix Um corresponding to each element of the unit recording unit matrix is large, and the number of units included in it is large, and the number of bits necessary to express this number is the unit. "When exceeding the number of recording units" or "When the number of unit recording units allocated to express information of one element of the unit recording unit matrix decreases because the number of columns of the unit recording unit matrix is increased" It becomes effective. In addition, since the tampering location is specified for each element of the unit recording unit matrix, the tampering location for the printed document can be specified in detail by increasing the number of rows and columns of the unit recording unit matrix for the same input document image. Although there is an advantage that it can be performed, it is necessary to increase the recording unit band or to reduce the number of unit recording units.
[0124]
The recording unit band is set in the margin of the document image so as not to overlap the character area of the document image. Even if the recording unit band is set at the right end, the upper end, or the lower end of the unit matrix Um, the same effect can be obtained if the subsequent processing is performed on the assumption that the recording unit band is above and below the document image. .
[0125]
Furthermore, recording unit bands may be set on the left and right of the unit matrix Um, and the same information may be set for each. In this case, even if the paper becomes dirty and the information on one recording unit belt cannot be read, the information from the other recording unit belt can be read to stably perform processing such as alteration detection. There is an effect that can be done. The same applies to the vertical direction.
[0126]
It is not necessary to know where the recording unit band is set in the document image by describing it in the attribute recording area described in the first embodiment.
[0127]
(Embedded signal number detection unit 3013)
In the following explanation, as in the explanation of the second embodiment,
The size of the signal unit embedded in the document by the digital watermark embedding apparatus 3001 is Sw × Sh (pixel).
The number of embedded signal units is horizontal × height = nw × nh.
-There are two types of embedded symbol units: Unit A and Unit B.
The size of the signal unit in the input image is Siw × Sih.
The explanation is based on the premise of
[0128]
FIG. 30 is an explanatory diagram of the embedded signal number detection unit 3013. The number of embedded signals is detected in the following steps.
Step 1: The input image is divided into Sw × Sh blocks and a unit matrix Um is set ((1) in FIG. 30).
Step 2: A portion corresponding to the recording unit band of the unit matrix Um is taken out ((2) in FIG. 30).
Step 3: The embedded bit string is restored by applying a signal detection filter to the recording unit band ((3) and (4) in FIG. 30). In FIG. 29 (3), the output values of two filters (filter A and filter B) are calculated for the area on the input image corresponding to each element of the unit matrix Um corresponding to the recording unit band, and the output value It is assumed that a symbol unit corresponding to a filter having a larger is embedded. In this example, since the output value of the filter A is large, it is determined that the unit A (symbol 0) is embedded.
Step 4: The unit number recording unit matrix is restored based on the restored bit string ((5) in FIG. 30).
[0129]
(Filter output value calculation unit 3014)
Figure 31 shows the fill T FIG. 14 is an explanatory diagram of an output value calculation unit 3014.
Here, the output value of the signal detection filter is recorded by the following steps for each element of the unit matrix Um set by the embedded signal number detection unit.
Step 1: The output value of the signal detection filter (filter A and filter B) is calculated for the region of the input image corresponding to an arbitrary element of the unit matrix Um (FIG. 30 (1)). The signal detection filter calculates the output value while shifting the target region up, down, left and right, and obtains the larger of the maximum value of the output value by the filter A and the maximum value of the output value by the filter B.
Step 2: Step 1 is performed on all the elements of the unit matrix Um, and the output values are recorded in the corresponding elements of the filter output value matrix Fm (x, y), x = 1 to Sw, y = 1 to Sh.
[0130]
(Optimum threshold determination unit 3015)
FIG. 32 is an explanatory diagram of the optimum threshold value determination unit 3015.
The threshold here is a threshold (referred to as Ts) for determining whether or not a unit symbol is embedded in the area of the input image corresponding to each area of the unit matrix Um, and is an arbitrary element of the filter output value matrix. If the value exceeds the threshold value Ts, it is determined that a symbol unit is embedded at a position corresponding to that of the input image. The optimum threshold determination is performed in the following steps.
Step 1: The initial value of the threshold value ts is set from the average Fa, standard deviation Fs, etc. of the elements of the filter output value matrix (output values of the signal detection filter) (FIG. 32 (1)). Here, for example, the initial value is ts = Fa−Fs * 3.
Step 2: The filter output value matrix is binarized by ts to create a unit extraction image ((2) in FIG. 32).
Step 3: The unit number recording unit matrix is applied to the unit extracted image ((3) in FIG. 32).
Step 4: The number of symbol units in the area corresponding to each element of the unit number recording unit matrix of the unit extracted image is counted and recorded in the unit number recording unit matrix ((4) in FIG. 32).
Step 5: The absolute value of the difference between the number of symbol units recorded in the recording unit band decoded by the embedded signal number detection unit 3013 and the number of symbol units obtained from Step 4 is calculated for each element of the unit number recording unit matrix. And the total value for all the elements is Sf (ts) ((3) in FIG. 32).
Step 6: Record ts at which Sf (ts) is minimum as Ts ((3) in FIG. 32).
Step 7: Δt is added to ts to update ts ((7) in FIG. 32). Δt may be calculated from a predetermined value or the standard deviation Fs obtained in step 1 (for example, Δt = Fs × 0.1).
Step 8: End if Ts reaches the expected value. Otherwise, the process returns to step 1 ((8) in FIG. 32).
[0131]
(Detection signal counting unit 3016)
FIG. 33 is an explanatory diagram of the detection signal counting unit 3016.
In this part of the processing, the unit extraction image obtained by binarizing the filter output value matrix with the optimal threshold value Ts obtained from the optimal threshold value determination unit 3015 is used to perform substantially the same processing as the optimal threshold value determination unit 3015.
Step 1: The filter output value matrix is binarized by Ts, and a unit extraction image is created (FIG. 33 (1)).
Step 2: The unit number recording unit matrix is applied to the unit extracted image ((2) in FIG. 33).
Step 3: The number of symbol units in the area corresponding to each element of the unit number recording unit matrix of the unit extracted image is counted and recorded in the unit number recording unit matrix ((3) in FIG. 33).
Step 4: The difference D (X, Y) between the number of symbol units recorded in the recording unit band decoded by the embedded signal number detection unit 3013 and the number of symbol units obtained from Step 3 is the unit number recording unit matrix. Is calculated for each element ((4) in FIG. 33). D (X, Y) in an arbitrary element Nu (X, Y) of the unit number recording unit matrix is the number of unit symbols restored from the recording unit band, R (X, Y), and the unit measured in step 3 Assume that the number of symbols is C (X, Y), and D (X, Y) = R (X, Y) −c (X, Y).
[0132]
(Falsification determination unit 3017)
Tampering determination in an arbitrary element N (X, Y) of the unit number recording unit is performed as follows using D (X, Y).
(1) Tampering with added characters: D (X, Y)> TA (TA is a positive integer) “If the number of detected unit symbols is smaller than the number of recorded unit symbols, the character is originally embedded. Judged that it was undetectable because a character was added on top of the unit symbol. "
(2) Tampering with erased characters: D (X, Y) <TC (TC is a negative integer) “If the number of detected unit symbols is larger than the number of recorded unit symbols, it is originally embedded. A unit symbol that was not detected was detected, and it was determined that after the character was erased with correction fluid, the image was contaminated with a non-character region, and the signal detection filter reacted to this. To detect tampering by erasing characters that could not be detected in the form. "
(3) No alteration: Other than (1) and (2)
[0133]
As described above, according to the present embodiment, the following effects can be obtained.
(F) By dividing the document image into several blocks and recording the number of symbol units embedded in each block, alteration detection can be performed in units of blocks, and the alteration location can be specified.
(G) By recording the number of embedded signals, it is possible to obtain an optimum threshold for signal detection and tamper detection.
(H) If a printed document contains an illegal character such as adding a character string to a blank area or erasing an arbitrary character string with correction fluid, the alteration is detected without the original document. And tampering locations can be identified.
[0134]
The preferred embodiments of the digital watermark embedding device, the digital watermark detection device, the digital watermark embedding method, and the digital watermark detection method according to the present invention have been described above with reference to the accompanying drawings. However, the present invention is limited to this example. Not. It will be obvious to those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea described in the claims, and these are naturally within the technical scope of the present invention. It is understood that it belongs.
[0135]
For example, the processing of the first embodiment is performed after the processing of the third embodiment, and the optimum threshold value Ts obtained by the optimum threshold value determination unit 3015 is set to the values in steps S1203 and S1204 of the first embodiment. You may use as threshold value Ts of a process (FIG. 18). Thereby, the accuracy of extraction of embedded information is improved as compared with the case where Ts is a fixed value.
[0136]
Similarly, the processing of the second embodiment may be performed after the processing of the third embodiment, and the optimum threshold Ts obtained by the optimum threshold determination unit 3015 may be used as the threshold Ts of the second embodiment. Is possible. Thereby, the accuracy of tampering detection is improved as compared with the case where Ts is a fixed value.
[0137]
【The invention's effect】
As described above, the main effects of the present invention are as follows.
(A) Referencing the character arrangement state of the document image into which the watermark is to be inserted, and embedding meaningful information (symbols of codewords) only in the area that does not overlap the character, so what the original document is Even confidential information can be embedded securely.
(B) By arranging the same number of conflicting signal units in the area where no symbol of the code word is embedded, it is possible to reliably determine that no symbol is embedded at the time of detection.
(C) When embedding information is detected, symbol determination is performed based on the sum of the output values of two filters for a certain area, so that the accuracy of information detection is kept high.
(D) By setting the attribute recording areas for setting the attribute information such as the number of embedded signals at the four corners of the signal embedding area, it is affected by hardware errors of the input / output device when detecting confidential information. Therefore, it is possible to accurately extract the attribute information without increasing the detection accuracy thereafter.
[0138]
Furthermore, according to the application example described in the embodiment of the present invention, the following effects can be further obtained.
(E) If there is a fraud in which an arbitrary character string is erased mainly with a correction liquid in a printed document, the alteration can be detected even if there is no original text of the document, and the alteration location can be specified.
(F) By dividing the document image into several blocks and recording the number of symbol units embedded in each block, alteration detection can be performed in units of blocks, and the alteration location can be specified.
(G) By recording the number of embedded signals, it is possible to obtain an optimum threshold for signal detection and tamper detection.
(H) If a printed document contains an illegal character such as adding a character string to a blank area or erasing an arbitrary character string with correction fluid, the alteration is detected without the original document. And tampering locations can be identified.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram illustrating a configuration of a digital watermark embedding device and a digital watermark detection device.
FIG. 2 is an explanatory diagram showing an example of a signal unit, where (1) shows a unit A and (2) shows a unit B.
3 is a cross-sectional view of the change in pixel value in FIG. 2A as viewed from the direction of arctan (1/3).
FIGS. 4A and 4B are explanatory diagrams illustrating an example of a signal unit. FIG. 4 illustrates a unit C, FIG. 4 illustrates a unit D, and FIG.
FIGS. 5A and 5B are explanatory diagrams of a background image, in which FIG. 5A shows a case where unit E is defined as a background unit and this is used as a background of a watermark image arranged without gaps, and FIG. An example in which the unit A is embedded in the image is shown, and (3) shows an example in which the unit B is embedded in the background image of (1).
FIG. 6 is an explanatory diagram showing an example of a unit pattern.
FIG. 7 is a flowchart showing a process flow of the watermark image forming unit 1006;
FIG. 8 is an explanatory diagram illustrating an example of a symbol unit arrangement availability matrix;
FIG. 9 is an explanatory diagram showing an example of a unit pattern arrangement availability matrix;
FIG. 10 is an explanatory diagram showing an example of a unit pattern matrix.
FIG. 11 is an explanatory diagram illustrating an example of a unit matrix.
FIG. 12 is an explanatory diagram of an attribute recording area.
FIG. 13 is an explanatory diagram showing an example of step S1107.
14 is an explanatory diagram showing a flow of processing of a watermark detection unit 1011. FIG.
FIG. 15 is an explanatory diagram of a signal region detection method.
FIG. 16 is an explanatory diagram illustrating an example of a method for restoring the size of a unit matrix embedded in an attribute region.
FIG. 17 is an explanatory diagram of steps S1203 and S1204.
FIG. 18 is an explanatory diagram of another method for realizing steps S1203 and S1204.
FIG. 19 is an explanatory diagram illustrating an example of a method of extracting a code word from a unit pattern matrix.
FIG. 20 is a diagram showing a configuration of a second exemplary embodiment of the present invention.
FIG. 21 is a flowchart showing the operation of the character erasure / alteration detection unit.
FIG. 22 is an explanatory diagram of a character region extraction image.
FIG. 23 is an explanatory diagram of step S2102.
FIG. 24 is an explanatory diagram of step S2103.
FIG. 25 is an explanatory diagram when tampering occurs.
FIG. 26 is an explanatory diagram showing a configuration of the third exemplary embodiment of the present invention.
FIG. 27 is a flowchart showing the operation of the embedded signal number recording unit 3012;
FIG. 28 is an explanatory diagram of step S3101.
FIG. 29 is an explanatory diagram of steps S3102 and S3103.
30 is an explanatory diagram of an embedded signal number detection unit 3013. FIG.
31 is an explanatory diagram of a fill row output value calculation unit 3014. FIG.
32 is an explanatory diagram of an optimum threshold value determination unit 3015. FIG.
33 is an explanatory diagram of a detection signal counting unit 3016. FIG.
[Explanation of symbols]
1001, 2001, 3001 Electronic watermark embedding apparatus
1002, 2002, 3002 Electronic watermark detection apparatus
1003, 2003, 3003 Document data
1004, 2004, 3004 Confidential information
1005, 2005, 3005 Document image forming unit
1006, 2006, 3006 Watermark image forming unit
1007, 2007, 3007 Watermarked document image composition unit
1008, 2008, 3008 Output device
1009, 2009, 3009 Printed document (paper)
1010, 2010, 3010 Input device
1011, 1011 Watermark detection unit
2012 Character Erase / Falsification Detection Unit
3012 Embedded signal recording unit
3013 Embedded signal number detection unit
3014 Filter output value calculation unit
3015 Optimal threshold determination unit
3016 Detection signal number counting unit
3017 Tampering determination unit

Claims (16)

文書画像に対して電子透かしにより機密情報を埋め込む,電子透かし埋め込み装置であって,
前記文書画像を参照して,前記機密情報を基に透かし画像を作成する透かし画像形成部を備え,
前記透かし画像形成部は,
前記文書画像を,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための埋め込み領域を算出し,前記埋め込み領域に対し,文字領域の割合が所定の閾値以下であるか否かを判断し,
文字領域の割合が所定の閾値以下である場合に,前記埋め込み領域の文字領域と重ならない領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット)を所定の数埋め込み,前記埋め込み領域の文字領域と重なる領域に,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)を埋め込み,
見かけの濃淡が均一となる前記透かし画像を形成することを特徴とする,電子透かし埋め込み装置。
An electronic watermark embedding device that embeds confidential information in a document image by electronic watermark,
A watermark image forming unit that creates a watermark image based on the confidential information with reference to the document image;
The watermark image forming unit
An embedding area for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter is calculated from the document image, and it is determined whether or not a ratio of a character area is equal to or less than a predetermined threshold with respect to the embedding area. And
A predetermined number of dot patterns (symbol units) that can identify a symbol that forms at least a part of the confidential information in an area that does not overlap the character area of the embedded area when the ratio of the character area is equal to or less than a predetermined threshold. embedding, in a region which overlaps with the buried region of the character region, embeds independent of the dot pattern is a symbol (background unit) from said secret information,
An electronic watermark embedding apparatus, characterized in that the watermark image having a uniform apparent shading is formed .
前記透かし画像形成部は,
前記文書画像を複数の埋め込み領域に分割し,各埋め込み領域ごとに,文字領域の割合が所定の閾値以下であるか否かを判断することを特徴とする,請求項1に記載の電子透かし埋め込み装置。
The watermark image forming unit
2. The digital watermark embedding according to claim 1, wherein the document image is divided into a plurality of embedding areas, and it is determined for each embedding area whether the ratio of the character area is equal to or less than a predetermined threshold value. apparatus.
前記透かし画像形成部は,
文字領域の割合が所定の閾値を超える前記埋め込み領域の,文字領域と重ならない領域に,前記シンボルユニットを複数種類,所定の数ずつ埋め込むことを特徴とする,請求項1または2に記載の電子透かし埋め込み装置。
The watermark image forming unit
3. The electron according to claim 1, wherein the symbol unit is embedded in a plurality of types and a predetermined number in a region that does not overlap the character region in the embedded region in which the ratio of the character region exceeds a predetermined threshold. Watermark embedding device.
前記シンボルユニットは,所定の方向に所定の間隔でドットが配置されるドットパターンであることを特徴とする,請求項1,2または3のいずれかに記載の電子透かし埋め込み装置。  4. The digital watermark embedding apparatus according to claim 1, wherein the symbol unit is a dot pattern in which dots are arranged at a predetermined interval in a predetermined direction. 前記シンボルユニットは,前記ドットの方向及び/又は間隔を変化させることによって,所定のフィルタによって所定のシンボルを識別可能であることを特徴とする,請求項1,2,3または4のいずれかに記載の電子透かし埋め込み装置。  5. The symbol unit according to claim 1, wherein a predetermined symbol can be identified by a predetermined filter by changing a direction and / or interval of the dots. The electronic watermark embedding device described. 前記文書画像と前記透かし画像とを重ね合わせて透かし入り文書画像を作成する透かし入り文書画像合成部と,
前記透かし入り文書画像を印刷する出力デバイスと,
をさらに備えたことを特徴とする,請求項1,2,3,4または5のいずれかに記載の電子透かし埋め込み装置。
A watermarked document image composition unit that creates a watermarked document image by superimposing the document image and the watermark image;
An output device for printing the watermarked document image;
The digital watermark embedding apparatus according to claim 1, further comprising:
前記透かし入り文書画像合成部は,
前記機密情報の埋め込み時及び/又は検出時の各種属性情報を,前記透かし入り文書画像の4隅部分に記録することを特徴とする,請求項6に記載の電子透かし埋め込み装置。
The watermarked document image composition unit
7. The digital watermark embedding apparatus according to claim 6, wherein various attribute information at the time of embedding and / or detecting the confidential information is recorded at four corners of the watermarked document image.
前記透かし画像に埋め込む前記シンボルユニット及び前記背景ユニットの数を,前記透かし画像の余白領域に記録する埋め込み信号数記録部をさらに備えたことを特徴とする,請求項1,2,3,4,5,6または7のいずれかに記載の電子透かし埋め込み装置。  An embedded signal number recording unit for recording the number of the symbol units and the background unit embedded in the watermark image in a blank area of the watermark image, further comprising: The digital watermark embedding device according to any one of 5, 6 and 7. 文書画像に対して請求項1〜8のいずれかに記載の電子透かし埋め込み装置により電子透かしにより埋め込まれた機密情報を検出する,電子透かし検出装置であって,
前記文書画像は,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割され,
前記各埋め込み領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット),あるいは,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)が埋め込まれることによって,前記機密情報が埋め込まれており,
前記機密情報を検出する透かし検出部を備え,
前記透かし検出部は,
前記ドットパターンから所定のシンボルを識別可能な複数種類のフィルタを備え,
前記各埋め込み領域ごとに,前記複数種類のフィルタによりマッチングを行い,
一の前記フィルタのマッチング数が他のすべての前記フィルタのマッチング数に比べて非常に大きい前記埋め込み領域から,前記一のフィルタに対応する,前記機密情報の少なくとも一部を検出することを特徴とする,電子透かし検出装置。
An electronic watermark detection apparatus for detecting confidential information embedded with a digital watermark by a digital watermark embedding apparatus according to any one of claims 1 to 8,
The document image is divided into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter,
A dot pattern (symbol unit) that can identify a symbol that forms at least a part of the confidential information or a dot pattern (background unit) that is a symbol unrelated to the confidential information is embedded in each embedded area. , The confidential information is embedded,
A watermark detection unit for detecting the confidential information;
The watermark detection unit
A plurality of types of filters capable of identifying a predetermined symbol from the dot pattern;
For each of the embedded regions, matching is performed using the plurality of types of filters,
Detecting at least a part of the confidential information corresponding to the one filter from the embedded region in which the number of matching of the one filter is much larger than the number of matching of all the other filters, A digital watermark detection device.
前記透かし検出部は,
前記各フィルタのマッチング数の間に差が無い前記埋め込み領域からは,前記機密情報を検出しないことを特徴とする,請求項9に記載の電子透かし検出装置。
The watermark detection unit
10. The digital watermark detection apparatus according to claim 9, wherein the confidential information is not detected from the embedded area where there is no difference between the matching numbers of the filters.
文字消去改ざん検出部をさらに備え,
前記文字消去改ざん検出部は,
前記機密情報が埋め込まれた文書画像を所定の閾値で二値化することにより,文字領域の画素値を0,背景領域の画素値を1として文字領域抽出画像を作成し,
前記機密情報が埋め込まれた文書画像の,前記シンボルユニットが検出できない領域の画素値を0,シンボルユニットが検出できる領域の画素値を1としてシンボルユニット抽出画像を作成し,
前記文字領域抽出画像と前記シンボルユニット抽出画像とを比較することにより,前記透かし入り文書画像に対する改ざんを検出することを特徴とする,請求項9または10に記載の電子透かし検出装置。
A character erasure / tamper detection unit;
The character erasure / alteration detection unit
By binarizing the document image in which the confidential information is embedded with a predetermined threshold value, a character region extraction image is created with a pixel value of the character region set to 0 and a pixel value of the background region set to 1,
A symbol unit extraction image is created by setting a pixel value of an area in which the symbol unit cannot be detected as 0 and a pixel value of an area in which the symbol unit can be detected as 1 in the document image in which the confidential information is embedded,
11. The digital watermark detection apparatus according to claim 9, wherein alteration of the watermarked document image is detected by comparing the character region extracted image and the symbol unit extracted image.
前記文書画像に対する前記機密情報の埋め込み時に埋め込まれた前記シンボルユニットの数を検出する,埋め込み信号数検出部と,
前記入力画像に対する前記所定のフィルタの出力値を算出し,各埋め込み領域ごとに記録する,フィルタ出力値算出部と,
前記埋め込み信号数検出部の検出値と,前記フィルタ出力値算出部の算出値とから,前記透かし画像に埋め込まれた前記シンボルユニットの数を検出するための最適な閾値を計算する,最適閾値判定部と,
前記透かし入り文書画像に実際に埋め込まれている前記シンボルユニットの数を検出する,検出信号計数部と,
前記埋め込み信号数検出部の検出値と,前記信号検出計数部の計数値とを比較することにより,前記透かし入り文書画像に対する改ざんの有無を判定する,改ざん判定部と,
をさらに備えたことを特徴とする,請求項9,10または11のいずれかに記載の電子透かし検出装置。
An embedded signal number detector for detecting the number of the symbol units embedded when the confidential information is embedded in the document image;
A filter output value calculation unit that calculates an output value of the predetermined filter for the input image and records it for each embedding area;
Optimal threshold determination for calculating an optimal threshold for detecting the number of the symbol units embedded in the watermark image from the detection value of the embedded signal number detection unit and the calculation value of the filter output value calculation unit Part,
A detection signal counting unit for detecting the number of the symbol units actually embedded in the watermarked document image;
A tampering determination unit that determines whether or not the watermarked document image has been tampered with by comparing a detection value of the embedded signal number detection unit with a count value of the signal detection counting unit;
The digital watermark detection apparatus according to claim 9, further comprising:
前記埋め込み信号数検出部は,
前記機密情報の埋め込み時に埋め込まれた前記シンボルユニットの数を,前記透かし入り文書画像の余白領域に記録された情報から検出することを特徴とする,請求項12に記載の電子透かし検出装置。
The embedded signal number detection unit includes:
13. The digital watermark detection apparatus according to claim 12, wherein the number of the symbol units embedded at the time of embedding the confidential information is detected from information recorded in a blank area of the watermarked document image.
前記最適閾値判定部は,
前記埋め込み信号数検出部の検出値と,前記フィルタ出力値算出部の算出値との差を,すべての前記埋め込み領域について合計し,合計値が最も小さくなるように,前記閾値を決定することを特徴とする,請求項12または13に記載の電子透かし検出装置。
The optimum threshold value determination unit
The difference between the detection value of the embedded signal number detection unit and the calculated value of the filter output value calculation unit is summed for all the embedded regions, and the threshold value is determined so that the total value is minimized. 14. The digital watermark detection apparatus according to claim 12, wherein the digital watermark detection apparatus is characterized.
文書画像に対して電子透かしにより機密情報を埋め込む,電子透かし埋め込み方法であって,
前記文書画像を,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割する第1工程と,
前記各埋め込み領域ごとに,文字領域の割合が所定の閾値以下であるか否かを判断する第2工程と,
文字領域の割合が所定の閾値以下である場合に,前記埋め込み領域の文字領域と重ならない領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット)を所定の数埋め込む第3工程と,
文字領域の割合が所定の閾値を超える前記埋め込み領域の,文字領域と重ならない領域に,前記シンボルユニットを複数種類,所定の数ずつ埋め込む第4工程と,
前記埋め込み領域の文字領域と重なる領域に,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)を埋め込む第5工程と,
を含むことを特徴とする,電子透かし埋め込み方法。
An electronic watermark embedding method for embedding confidential information in a document image with an electronic watermark,
Dividing the document image into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter;
A second step of determining whether the ratio of the character area is equal to or less than a predetermined threshold value for each of the embedded areas;
When the ratio of the character area is equal to or less than a predetermined threshold, a predetermined number of dot patterns (symbol units) that can identify a symbol that forms at least a part of the confidential information in an area that does not overlap the character area of the embedded area A third step of embedding;
A fourth step of embedding a plurality of types and a predetermined number of the symbol units in an area that does not overlap the character area of the embedding area in which the ratio of the character area exceeds a predetermined threshold;
A fifth step of embedding a dot pattern (background unit) which is a symbol irrelevant to the confidential information in an area overlapping the character area of the embedding area;
A method for embedding a digital watermark, comprising:
文書画像に対して請求項15に記載の電子透かし埋め込み方法により電子透かしにより埋め込まれた機密情報を検出する,電子透かし検出方法であって,
前記文書画像は,所定のフィルタによって所定のシンボルを識別可能なドットパターンを埋め込むための複数の埋め込み領域に分割され,
前記各埋め込み領域に,前記機密情報の少なくとも一部を成すシンボルを識別可能なドットパターン(シンボルユニット),あるいは,前記機密情報とは無関係のシンボルであるドットパターン(背景ユニット)が埋め込まれることによって,前記機密情報が埋め込まれており,
前記各埋め込み領域ごとに,複数種類のフィルタによりマッチングを行い,
一の前記フィルタのマッチング数が他のすべての前記フィルタのマッチング数に比べて非常に大きい前記埋め込み領域からは,前記一のフィルタに対応する,前記機密情報の少なくとも一部を検出し,
前記各フィルタのマッチング数の間に差が無い前記埋め込み領域からは,前記機密情報を検出しないことを特徴とする,電子透かし検出方法。
An electronic watermark detection method for detecting confidential information embedded in a digital image by a digital watermark embedding method according to claim 15, comprising:
The document image is divided into a plurality of embedding areas for embedding a dot pattern capable of identifying a predetermined symbol by a predetermined filter,
A dot pattern (symbol unit) that can identify a symbol that forms at least a part of the confidential information or a dot pattern (background unit) that is a symbol unrelated to the confidential information is embedded in each embedded area. , The confidential information is embedded,
For each of the embedded regions, matching is performed using a plurality of types of filters.
Detecting at least a part of the confidential information corresponding to the one filter from the embedded region in which the matching number of the one filter is very large compared to the matching numbers of all the other filters;
The electronic watermark detection method according to claim 1, wherein the confidential information is not detected from the embedded area where there is no difference between the matching numbers of the filters.
JP2002003153A 2002-01-10 2002-01-10 Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method Expired - Fee Related JP3964684B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002003153A JP3964684B2 (en) 2002-01-10 2002-01-10 Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002003153A JP3964684B2 (en) 2002-01-10 2002-01-10 Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method

Publications (2)

Publication Number Publication Date
JP2003209676A JP2003209676A (en) 2003-07-25
JP3964684B2 true JP3964684B2 (en) 2007-08-22

Family

ID=27642816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002003153A Expired - Fee Related JP3964684B2 (en) 2002-01-10 2002-01-10 Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method

Country Status (1)

Country Link
JP (1) JP3964684B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8614835B2 (en) 2009-03-18 2013-12-24 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004019478D1 (en) 2003-08-21 2009-04-02 Ricoh Kk A method, program and apparatus for preventing the reproduction of copy-protected documents, and a medium for storing the program
JP2005150815A (en) * 2003-11-11 2005-06-09 Oki Electric Ind Co Ltd Watermark information embedding apparatus and method, watermark information detecting apparatus and method, and printed matter
WO2005074249A1 (en) * 2004-02-02 2005-08-11 Nippon Telegraph And Telephone Corporation Electronic watermark embedding device, electronic watermark detection device, method thereof, and program
EP1713248A4 (en) * 2004-02-02 2010-08-04 Nippon Telegraph & Telephone Electronic watermark embedding device, electronic watermark detection device, method thereof, and program
JP4785393B2 (en) * 2004-03-08 2011-10-05 株式会社リコー Image processing apparatus, image processing system, image processing method, and image processing program
JP3930502B2 (en) 2004-03-29 2007-06-13 沖電気工業株式会社 Quality adjustment system and watermark quality inspection device
JP2006121655A (en) * 2004-09-24 2006-05-11 Ricoh Co Ltd Apparatus and method for detecting alteration, and program for computer to implement the method
JP2006157831A (en) * 2004-12-01 2006-06-15 Oki Electric Ind Co Ltd Tampering detector, watermarked image outputting device, watermarked image inputting device, watermarked image output method, and watermarked image input method
JP4437756B2 (en) 2005-02-25 2010-03-24 株式会社リコー Information extraction method, information extraction apparatus, information extraction program, and storage medium
JPWO2006115128A1 (en) * 2005-04-21 2008-12-18 松下電器産業株式会社 Digital watermark detection device, method, program, and integrated circuit device
JP4532349B2 (en) 2005-06-07 2010-08-25 株式会社リコー Image processing method, image processing apparatus, image processing program, and recording medium
JP2007143123A (en) * 2005-10-20 2007-06-07 Ricoh Co Ltd Image processing apparatus, image processing method, image processing program, and recording medium
JP4668086B2 (en) * 2006-02-23 2011-04-13 株式会社沖データ Image processing apparatus, image processing method, and computer program
CN100363948C (en) * 2006-03-31 2008-01-23 天津市阿波罗信息技术有限公司 Screen coding embedded information communication device
JP2007324677A (en) * 2006-05-30 2007-12-13 Fuji Xerox Co Ltd Image processing apparatus, image processing method, image forming apparatus and program
WO2008035394A1 (en) * 2006-09-19 2008-03-27 Fujitsu Limited Electronic watermark embedding device
WO2008035401A1 (en) 2006-09-19 2008-03-27 Fujitsu Limited Electronic watermark embedding device and detection device
JP2008085695A (en) 2006-09-28 2008-04-10 Fujitsu Ltd Electronic watermark embedding apparatus and detection apparatus
US8056821B2 (en) * 2006-10-18 2011-11-15 Xerox Corporation Security marks simulating natural defects for embedding information in documents
JP4810413B2 (en) 2006-12-05 2011-11-09 キヤノン株式会社 Image processing apparatus and image processing method
JP4740166B2 (en) 2007-01-31 2011-08-03 株式会社リコー Image forming apparatus, image forming system, image forming method, program, and recording medium
JP4758930B2 (en) * 2007-03-23 2011-08-31 株式会社日立製作所 Information embedding device, information embedding method and program thereof
WO2009004669A1 (en) * 2007-07-03 2009-01-08 Fujitsu Limited Watermark-embedding device
US7876473B2 (en) 2007-10-18 2011-01-25 Kabushiki Kaisha Toshiba Apparatus and method for information burying
JP4962335B2 (en) 2008-02-04 2012-06-27 富士通株式会社 Method for restoring embedded data
JP5011233B2 (en) 2008-08-25 2012-08-29 株式会社Pfu Information output system, method and program for falsification detection
JP7451159B2 (en) * 2019-12-09 2024-03-18 キヤノン株式会社 Image processing device, image processing method, and program
CN112650992A (en) * 2020-12-21 2021-04-13 江苏群杰物联科技有限公司 Document tracking encryption method based on digital watermark

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8614835B2 (en) 2009-03-18 2013-12-24 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product

Also Published As

Publication number Publication date
JP2003209676A (en) 2003-07-25

Similar Documents

Publication Publication Date Title
JP3964684B2 (en) Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method
US7245740B2 (en) Electronic watermark embedding device, electronic watermark detection device, electronic watermark embedding method, and electronic watermark detection method
JP4277800B2 (en) Watermark information detection method
JP3628312B2 (en) Watermark information embedding device and watermark information detection device
US7039215B2 (en) Watermark information embedment device and watermark information detection device
JP5253352B2 (en) Method for embedding a message in a document and method for embedding a message in a document using a distance field
US7085399B2 (en) Watermark information embedding device and watermark information detection device
KR101086802B1 (en) Watermark information embedding device and method, watermark information detecting device and method, watermarked document
JP4819723B2 (en) Information extraction apparatus, information extraction method, information extraction program, and recording medium
JP2007134987A (en) Watermark information embedding device, watermark information embedding method, and computer program
JP3930502B2 (en) Quality adjustment system and watermark quality inspection device
US20080260200A1 (en) Image Processing Method and Image Processing Device
KR100971103B1 (en) Watermark information embedding device, image processing device, watermark information embedding method, and image processing method
EP1684496A1 (en) Watermark information embedding device, watermark information detection device, watermark information embedding method, watermark information detection method, and printed matter
JP3980983B2 (en) Watermark information embedding method, watermark information detecting method, watermark information embedding device, and watermark information detecting device
JP4469301B2 (en) Information embedding device, printing medium, and information reading device
JP2008085579A (en) Device for embedding information, information reader, method for embedding information, method for reading information and computer program
JP4192887B2 (en) Tamper detection device, watermarked image output device, watermarked image input device, watermarked image output method, and watermarked image input method
JP4096902B2 (en) Watermark information detection apparatus and watermark information detection method
JPWO2004084539A1 (en) Entry document creation device and creation method, entry content extraction device and extraction method, entry document
JP3682864B2 (en) How to embed invisible information
JP2006157831A (en) Tampering detector, watermarked image outputting device, watermarked image inputting device, watermarked image output method, and watermarked image input method

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20040428

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20040510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040830

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050203

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050208

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070524

R150 Certificate of patent or registration of utility model

Ref document number: 3964684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees