以下に添付図面を参照しながら,本発明の好適な実施の形態について詳細に説明する。なお,本明細書及び図面において,実質的に同一の機能構成を有する構成要素については,同一の符号を付することにより重複説明を省略する。
本実施形態にかかる改ざん検出システムは,印刷前の画像の特徴量と印刷後の画像の特徴量を用いて印刷後の画像が改ざんされているか否かを検出するシステムである。本システムは,印刷後の画像が改ざんされているか否かを検出する改ざん検出機能と,改ざん検出機能が改ざん有無を判定する際に使用する閾値を決定する閾値決定機能を含む。本実施形態にかかる改ざん検出システムは,改ざん検出機能を有する改ざん検出装置40と,閾値決定機能を有する閾値決定装置30を備えているが,ひとつの装置に両機能が備えられていてもよいし,3つ以上の複数の装置に各機能が分散されていてもよい。
まず,本実施形態にかかる閾値決定装置30について説明する。閾値決定装置30は,改ざん検出装置40が,改ざんされている画像を改ざん無しと判断する改ざんの見逃しを行う確率を低くするように適切な閾値を決定する。画像の改ざんを行う場合には,できるだけ元の画像を利用して相違点が少なくなるようにしながらその画像を改ざんすることが一般的である。具体的には例えば,印刷物に印刷された数字の「1」を「4」に改ざんする場合には,「1」の縦棒を利用して「4」の縦棒が「1」の縦棒と重なるようにして改ざんすれば,改ざん前と改ざん後との相違点が最も少なくなると考えられる。閾値決定装置30は,そのように相違点が少なくなるように巧妙に改ざんされた場合であっても,改ざん検出装置40が改ざんを見逃すことが無いような適切な閾値を決定することを特徴とする。
そこで,まず上記の特徴を有さない閾値決定装置20による閾値決定機能を比較例として説明し,その後に,閾値決定装置30が備える特徴的な機能について説明する。閾値決定装置30は,閾値決定装置20が行う閾値決定機能を行うことができ,さらに後述する特徴的な機能を実行する。
閾値決定装置20は,評価対象データ作成装置10によって作成された評価対象データに基づいて閾値を決定する。そこで,まず図1から図10に基づいて評価対象データ作成装置10と閾値決定装置20により行われる閾値決定処理について説明する。なお,評価対象データ作成装置10が備える各機能を閾値決定装置20に備え,1つの装置によって実現されてもよい。
図1は,評価対象データ作成装置10の機能構成を示すブロック図である。評価対象データ作成装置10は,例えば,テストチャート生成部102と,マーク挿入部104と,印刷出力部106と,読み取り部108と,マーク検出部112と,位置情報算出部114と,画像切り出し部116と,評価対象データ出力部118と,領域記憶部120と,読み取り画像領域記憶部122と,改ざん画像作成部124と,改ざん領域記憶部126などを備える。
テストチャート生成部102は,評価対象データの元となる元画像の一例であるテストチャート画像を作成し,テストチャート画像の任意の領域に関する情報を領域情報として領域記憶部120に記憶させる機能を有する。具体的には,評価対象データ作成装置10に備えられるキーボード等の入力手段からユーザによって入力された文字や記号のテキストデータを取得し,それら複数のテキストデータを含む文書を画像変換して文書画像であるテストチャート画像を作成する。なお,評価対象データ作成装置10は,ユーザ等に指定された種類やサイズのフォントのテキストデータで文書画像を生成してもよい。テストチャート生成部102は,生成したテストチャート画像の任意の領域の画像特定情報と,その領域の位置情報とを関連付けて領域記憶部120に記憶させる。本例では,画像特定情報の一例として上述のテキストデータを用いる。つまり,テストチャート生成部102によって,任意の領域に含まれる文字や記号等のテキストデータと,その領域の位置情報を示す座標とが関連付けられ,領域記憶部120に記憶される。
マーク挿入部104は,テストチャート画像の4つの角部のうち少なくとも対向する2つの角部にマークを挿入する機能を有する。本例では,マークは電子透かしであり,マーク挿入部104はテストチャート画像の4つの角部を含めた全領域に上記電子透かしを埋め込む。マークは,テストチャート画像が印刷された場合に,印刷物の中からテストチャート画像部分を特定できるものであれば,テストチャート画像の外枠を囲む罫線等何でもよい。また,マークが電子透かしである場合でも,本例のようにテストチャート画像の全領域に埋め込むのではなく,4つの角部のうち少なくとも対向する2つの角部にのみ埋め込んでも構わない。本例ではマーク挿入部102がテストチャート画像の全領域に電子透かしを埋め込み,テストチャート画像が印刷された印刷物をスキャナ等で読み取って作成された読み取り画像から後述のマーク検出部112が電子透かしが埋め込まれている領域を検出することによって,印刷物の中からテストチャート画像部分を特定することができる。
マーク挿入部104がテストチャート画像に電子透かしを埋め込み,マーク検出部112が読み取り画像から電子透かしが埋め込まれた領域を検出するためには,例えば以下のような電子透かし技術を用いることができる。なお,本例では,電子透かしは印刷物におけるテストチャート画像部分の検出に用いられるだけであるので,電子透かしとしてテストチャート画像に埋め込む情報は何でもよい。
例えば,特開2003−209676号公報「電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出方法」に示されているように,該電子透かし技術は,任意のドットパターンを用紙に埋め込み,目視を目的とする物理的な情報以外に電子透かしとして情報を伝達する技術である。
また,電子透かし技術は,用紙に任意の情報を埋め込めるだけでなく,埋め込まれる小さな独自のパターン自体がそのパターン同士の位置関係または用紙に対する位置関係を示し,スキャナ等によって画像が読み取られた後の画像を補正するための基準として利用される。
図24は,電子透かしに埋め込む任意のパターンを説明するための説明図である。図24を参照すると,かかる電子透かしによる画像は,複数の小さなドットで構成されたN個のユニットパターンの集合として表される。この各ユニットパターンが0〜N−1の数値に対応し,例えば,ユニットパターン902は数値0を表し,ユニットパターン904は数値1を表す。上記ユニットパターンは,白黒やカラーで表すことができる。
図25は,電子透かしによって印刷された画像(用紙)を説明するための外観図である。図25の用紙全体を参照すると,上記電子透かしによる画像には,その役割に応じて,メイン領域910,属性情報領域912,境界情報領域914に分けることができる。メイン領域910は,情報を埋め込むための主たる領域である。属性情報領域912は,電子透かしを埋め込む領域の大きさやメイン領域910における情報の符号化方法など,メイン領域910に埋め込まれた情報を読み取るために必要な情報が格納されている。境界情報領域914は,予め定められた特定のユニットパターンが印刷されており,読み取り側はこの領域によって電子透かしの境界を識別することができる。
スキャナ等の読み取り側では,このようにして印刷された用紙(以下,単に電子透かし用紙という。)をスキャニングし,用紙中に埋め込まれた個々のユニットパターンを検出する。この検出は,テンプレートマッチングや,任意の方向性や形状に対するフィルタ特性を持つ2次元フィルタ(例えば2次元ガボールフィルタ)等を利用して行われる。
また,上記用紙に電子透かしを埋め込む際,上記境界情報領域914やメイン領域910の特定位置に,特定のユニットパターンを規則正しく配置する。これによって,用紙を読み取る側では,これら位置検出用のユニットパターンを抽出し,この位置情報に基づいて補正を行うことができる。従って,スキャニングしたデータに変位や回転によるズレまたはしわによる偏りがあったとしても,煩わしい手動による補正を行うことなく,元の画像を復元することができる。
また,印刷時やスキャニング時などに,このユニットパターンの一部が例えばインクなどで汚され,検知できなくなる可能性が生じる。そこでメイン領域910においては埋め込む情報を複数箇所に分散して配置したり,上記特開2003−209676号公報にあるように誤り耐性符号(パリティチェック符号,ハミング符号,BCH符号など)で埋め込んだりして,例え,ユニットパターンの一部が欠けていたとしても情報の復元が可能なように構成されている。
図1に戻り,評価対象データ作成装置10の機能構成の説明を続ける。印刷出力部106は,電子透かしが埋め込まれたテストチャート画像を印刷する機能を有する。印刷出力部106は画像出力部の一例である。なお,画像出力部は,本例のようにテストチャート画像を印刷してもよいし,電子データとしてCD(Compact Disk)やフレキシブルディスク等の外部記録媒体に出力してもよい。またはLAN(Local Area Network)等の通信網を介して通信接続された外部のコンピュータに電子データを送信しても構わない。
読み取り部108は,テストチャート画像が印刷された印刷物を読み取り,読み取り画像を作成する機能を有する。具体的には,スキャナ等の読み取り手段を介して印刷物を読み取り,読み取られたデータに基づいて読み取り画像を作成する。なお,テストチャート画像が印刷された印刷物には,テストチャート画像部分の他に余白部分が含まれている場合があるが,読み取り部108によって作成される読み取り画像には,そのような余白部分も含まれている。また,読み取り時にテストチャート画像が縮小される場合もある。
マーク検出部112は,読み取り画像からマークが挿入されている位置情報を検出する機能を有する。具体的には,読み取り画像に埋め込まれている電子透かしの境界を,上記境界情報領域を利用するなどして識別する。そして,その境界によって区分される領域,すなわち電子透かしが埋め込まれている領域(以後,透かし領域とも称する。)の,読み取り画像における位置情報を,例えばその領域の開始位置の座標と終了位置の座標とを取得することによって検出する。本例では,テストチャート画像の全領域に電子透かしが埋め込まれているため,印刷前のテストチャート画像における透かし領域の開始位置の座標は(0,0)である。読み取り画像では,上述のように余白部分が含まれる場合があるため,透かし領域の開始位置は(0,0)であるとは限らない。
位置情報算出部114は,テストチャート画像の任意の領域の位置情報およびマークの位置情報に基づいて,読み取り画像における,テストチャート画像の任意の領域に対応する領域の位置情報を算出する機能を有する。具体的には位置情報算出部114は,領域記憶部120に記憶されている領域情報を取得し,その領域情報に含まれる座標と,マーク検出部112によって検出された透かし領域を特定する座標とに基づいて,領域情報に含まれる座標によって特定される印刷前のテストチャート画像上の領域に対応する読み取り画像上の領域を特定する座標を求める。テストチャート画像上の領域に対応する読み取り画像上の領域を取得する際に,テストチャート画像上の領域を特定する座標をそのまま利用すると,上述のように読み取り画像に余白部分が含まれている場合にはテストチャート画像の開始位置がずれるため,異なる領域を取得してしまう。そこで,透かし領域の位置情報を用いて算出することによって,余白部分により上記開始位置がずれた場合でも対応する領域を取得することが可能となる。
また,位置情報算出部114は,印刷前のテストチャート画像と読み取り画像におけるテストチャート画像のサイズの違いを考慮して位置情報を算出してもよい。テストチャート画像の開始位置(0,0)と終了位置の組み合わせ,またはテストチャート画像のサイズを,例えばテストチャート生成部102が領域記憶部や他の記憶部に記憶させることによって,またはマーク挿入部がテストチャート画像に上記情報(開始位置と終了位置の組み合わせ又はサイズ)を埋め込むことによって,位置情報算出部114はテストチャート画像のサイズを取得することができる。位置情報算出部114は,マーク検出部112によって検出された透かし領域の位置情報によって透かし領域のサイズを取得することもできるため,印刷前のテストチャート画像のサイズと透かし領域のサイズとの比率を,位置情報の算出に用いることによって,印刷前のテストチャート画像と読み取り画像におけるテストチャート画像のサイズの違いを考慮して位置情報を算出することができる。
読み取り画像領域記憶部122には,位置情報算出部114によって算出された位置情報と,その位置情報によって特定される領域に含まれる画像特定情報(テキストデータ)とが関連付けられた読み取り画像領域情報が記憶されている。
画像切り出し部116は,テストチャート画像の任意の領域の位置情報に基づいてテストチャート画像からその任意の領域の画像を切り出し,かつ,位置情報算出部114によって算出された位置情報によって特定される領域の画像を読み取り画像から切り出す機能を有する。具体的には画像切り出し部116は,領域記憶部120から任意の領域情報を取得し,その領域情報に含まれる座標によって特定される領域の画像を切り出す(以後,元画像からの切り出し画像とも称する。)。また,読み取り画像領域記憶部122から任意の読み取り画像領域情報を取得し,その読み取り画像領域情報に含まれる座標によって特定される領域の画像を切り出す(以後,読み取り画像からの切り出し画像とも称する。)。本明細書において,座標によって特定される領域の画像を切り出すとは,テストチャート画像または読み取り画像から特定領域の画像を切り取って,またはコピーして,切り取りまたはコピーした画像をそのままで,またはサイズの変更や2値化を行うなどして,ひとつの画像とすることを意味する。従って,ひとつのテストチャート画像または読み取り画像から,複数の画像を作成することができる。なお,以後,マーク検出部112,位置情報算出部114および画像切り出し部116をまとめて評価画像生成部110とも称する。
評価対象データ出力部118は,画像切り出し部116によって切り出された一組の画像と,各画像の画像特定情報と,を含む評価対象データを出力する機能を有する。具体的には評価対象データ出力部118は,画像切り出し部116から,元画像からの切り出し画像,および読み取り画像からの切り出し画像,並びに各画像に含まれている画像特定情報を取得し,それらを1セットでひとつの評価対象データとし,CD等の外部記録媒体に出力する。各画像に含まれる画像特定情報は,画像切り出し部116が自己が切り出した画像の領域と関連付けられて記憶されている画像特定情報を領域記憶部120や読み取り画像領域記憶部122から検索することによって取得することができる。なお,評価対象データ出力部118は,上記のように外部記録媒体に評価対象データを出力するのではなく,評価対象データを用いて閾値の決定を行う閾値決定装置20に送信したり,評価対象データ作成装置10の内部または外部の閾値決定装置20が参照可能な記憶領域に記憶させてもよい。
改ざん画像作成部124は,改ざん画像を作成する機能を有する。具体的には,画像切り出し部116によって読み取り画像から切り出された画像を,テストチャート画像の任意の領域に対応する領域の位置情報によって特定される読み取り画像上の領域であって,かつ,切り出された画像の切り出し元とは異なる任意の領域に貼り付けて改ざん画像を作成する。すなわち,改ざん画像作成部124は,画像切り出し部116から,読み取り画像からの切り出し画像を取得し,取得した画像を,読み取り画像領域記憶部122に記憶されているいずれかの読み取り画像領域情報に含まれる座標によって特定される領域に貼り付ける。なお,貼り付けは,上記で画像切り出し部116から取得した切り出し画像の切り出し元の領域とは異なる領域に対して行われる。かかる処理により,貼り付け先の領域では,貼り付け前と貼り付け後で画像特定情報が異なり,従って,貼り付け先の領域ではテストチャート画像の対応領域に含まれる画像特定情報とは異なる画像特定情報が含まれることになる。改ざん画像作成部124は,上記の貼り付け処理後,貼り付け先の領域を特定する位置情報と,貼り付け前のその領域の画像特定情報と貼り付け後の同領域の画像特定情報とを,改ざん領域情報として改ざん領域記憶部126に記憶させる。なお,貼り付け先の領域を特定する位置情報のみを改ざん領域記憶部126に記憶させても構わない。また,改ざん領域情報を改ざん領域記憶部126に記憶させるのではなく,改ざん画像に電子透かしとして埋め込んでもよい。
以上,評価対象データ作成装置10の機能構成について説明した。次に,図2に基づいて,本実施形態の比較例にかかる閾値決定装置20の機能構成について説明する。
閾値決定装置20は,例えば,評価対象データ入力部202と,特徴量計測部204と,特徴量差分算出部206と,集計対象データ記憶部208と,集計部210と,閾値決定部212などを備える。
評価対象データ入力部202は,一組の画像と,各画像の画像特定情報と,を含む評価対象データを入力する機能を有する。本例では,評価対象データ作成部10によって出力された評価対象データを,例えば評価対象データが記録されている外部記録媒体から読み込むことにより入力する。閾値決定装置20が評価対象データ作成装置10と通信接続されていれば,通信網を介して評価対象データを受信してもよい。または,評価対象データ作成装置10の内部または外部の記憶領域に記憶されている評価対象データを読み込んでも良い。なお,一組の画像と,各画像の画像特定情報とは評価対象データ作成装置10によって作成されたものでなくても構わない。
特徴量計測部204は,入力された一組の画像の各々の特徴量を計測する機能を有する。特徴量を計測する方法としては,各画像に対してガボールフィルタや公知のフィルタによるフィルタリング処理を行い,フィルタ出力の平均値を求めるなどすることによって各画像の特徴量を得る方法を適用することができる。また,画像を複数の領域に分割し,分割された領域ごとに特徴量を計測することによって,より詳細に特徴量を計測してもよい。また,フィルタリングによる特徴量計測以外にも,縮小画像の生成によるパターンマッチングを行い,その一致度を計測する方法も適用可能である。画像から計測される特徴量は,同一の画像ではほぼ同一の特徴量となる。ただし,同一の画像であっても,印刷前の画像と印刷物の読み取り画像とでは,プリンタやスキャナの性能などによっては読み取り画像に汚れ,インクの滲み,変形等が発生し,その結果,印刷前の画像の特徴量と読み取り画像の特徴量とが異なる場合がある。
特徴量差分算出部206は,特徴量計測部204によって計測された一組の画像の特徴量の差分値を求める機能を有する。また,特徴量差分算出部206は,特徴量計測部204によって特徴量を計測された一組の画像の各々に含まれる画像特定情報と,求めた差分値とを関連付けた集計対象データを,集計対象データ記憶部208に記憶させる。特徴量差分算出部206は,各画像に含まれる画像特定情報を,評価対象データ入力部202によって入力された評価対象データを参照することによって取得できる。特徴量差分算出部206は,評価対象データに含まれる各画像の画像特定情報が同一である場合,すなわち,その評価対象データに含まれる一組の画像が含んでいる画像特定情報が同一である場合と,異なる場合とで区別して集計対象データ記憶部208に上記集計対象データを記憶させる。従って,集計対象データ記憶部208には,一組の画像の画像特定情報が同一である第1グループ,または同一でない第2グループのいずれかに対応付けて複数の差分値が記憶されている。なお,特徴量差分算出部206は,上記のように第1グループと第2グループとに区別可能なように集計対象データを集計対象データ記憶部208に記憶させれば,各画像の画像特定情報は記憶させなくても構わない。
集計部210は,集計対象データ記憶部208に記憶されている集計対象データに基づいて,上記第1グループに対応付けられた差分値の度数分布,および上記第2グループに対応付けられた差分値の度数分布を作成する機能を有する。
閾値決定部212は,集計部210によって作成された度数分布のどちらか一方または双方に基づいて,改ざん検出有無の判定のための閾値を決定する機能を有する。印刷前の画像と印刷後の読み込み画像との特徴量が相違している場合でも,その違いの原因が上記の如く画像を印刷,読み込みしたことにある場合には,改ざん検出装置等では改ざん有りと判断されるべきではない。そこで,上記集計部210により,一組の画像の画像特定情報が同一である第1グループの特徴量の差分値の度数分布と,同一でない第2グループの特徴量の差分値の度数分布とが作成されることにより,閾値決定部212は,一組の画像の特徴量の間に差があっても改ざん無しと判断するべき差分の値(許容される差分の範囲)を取得することができる。閾値決定部212がその値を閾値に決定することによって,その閾値を改ざん有無の判定に用いる改ざん検出装置等は適切な判定を行うことができる。
また,詳細は後述するが,閾値決定部212は,ユーザによって指定されたパラメータに基づいて,そのパラメータによって指定される検出精度を満たすことが可能な値を閾値とすることができる。なお,本明細書において改ざんの検出精度は,改ざん見逃し率と改ざん誤検出率とで表される。改ざん見逃し率とは,改ざん検出装置等が,判定対象の画像が改ざんされているにもかかわらず改ざん無しと誤って判断してしまう確率である。改ざん誤検出率とは,改ざん検出装置等が,判定対象の画像が改ざんされていないにもかかわらず改ざん有りと誤って判断してしまう確率である。
以上,閾値決定装置20の機能構成について説明した。次に,図4から図12に基づいて,評価対象データ作成装置10の処理の流れについて説明する。
まず,評価対象データ作成装置10の処理の流れを概略的に説明し,その後図3から図12に基づいてより詳細な説明を行う。
まず,テストチャート生成部102に評価文字として文字や記号のテキストデータが入力される。また,出力フォント情報としてフォントの種類やサイズなども入力される。テストチャート生成部102は,入力されたデータに基づいてテストチャート画像を作成し,かつ,ひとつの評価文字のテキストデータ(画像特定情報)が含まれる領域の位置情報を,その評価文字と関連付けた領域情報として領域記憶部120に記憶させる。
作成されたテストチャート画像はマーク挿入部104に提供され,マーク挿入部104はテストチャート画像の全領域に電子透かしを埋め込む。電子透かしが埋め込まれたテストチャート画像は印刷出力部106によって印刷され,テストチャート画像が印刷された印刷物が出力される。
その後,印刷物は読み取り部108によって読み取られ,読み取り画像が作成される。作成された読み取り画像は評価画像生成部110に提供され,評価画像生成部110は領域記憶部120に記憶されている領域情報と透かし領域とに基づいて,評価対象の一対の画像を作成する。評価対象データ出力部118は,評価画像生成部110によって作成された一対の画像と,各画像に含まれる画像特定情報である評価文字の組み合わせと,を含む評価対象データを出力する。以上,処理の流れの概略について説明した。
続いて,詳細な説明を行う。図3に示すように,テストチャート生成部102が作成するテストチャート画像1002には,評価文字のテキストデータが複数含まれている。図示の例によれば,評価文字「0」を含む領域は,座標(200,200)および(300,300)によって特定される領域である。従って,領域記憶部120には,評価文字「0」と,「0」を含む領域を特定する位置情報「200,200,300,300」とが関連付けられて1つの領域情報として記憶されている。同様に,領域記憶部120には,評価文字「1」と,「1」を含む領域を特定する位置情報「400,200,500,300」や,評価文字「2」と,「2」を含む領域を特定する位置情報「600,200,700,300」が各々関連付けられ,各々が領域情報として記憶されている。
テストチャート画像1002の全領域には,図4に示すようにマーク挿入部104によって電子透かしが埋め込まれ,透かし埋め込み画像1003は印刷出力部106によって印刷され,透かしが埋め込まれたテストチャート画像が印刷された印刷物1004が出力される。印刷物1004は,図5に示すように読み取り部108によって読み取られ,読み取り画像1005が作成される。作成された読み取り画像と,領域記憶部120に記憶されている領域情報が評価画像生成部110に提供される。評価画像生成部110は上述のとおりマーク検出部112,位置情報算出部114および画像切り出し部116を備えている。
評価画像生成部110に提供された読み取り画像1005に対して,まずマーク検出部112が透かし領域の検出処理を行う。図6の例によれば,検出された透かし領域は,読み取り画像1005において座標(235,115)および(3200,4480)によって特定されるの領域である。透かし領域が特定されると,透かし領域のサイズを計算することが可能になり,図示の例によれば透かし領域のサイズは2965×4365である。一方,テストチャート画像は,座標(0,0)から(4488,6543)に渡っており,そのサイズは4488×6543である。そうすると,読み取り画像1005における透かし領域,すなわち読み取り画像1005におけるテストチャート画像部分は,座標(235,115)から開始しており,さらに印刷前の元のテストチャート画像1002の2/3倍のサイズであることがわかる。
位置情報算出部114は,マーク検出部による透かし領域の検出によって得られた上記情報,つまり透かし領域の開始位置およびサイズ比と,領域記憶部120に記憶されている領域情報とに基づいて,読み取り画像領域情報を作成する。より具体的には,図示の例によれば,元のテストチャート画像1002において評価文字「0」を含む領域に対応する読み取り画像1005上の領域を特定する座標は,下記の計算により求めることができる。
(200×2/3+235,200×2/3+115,300×2/3+235,300×2/3+115)=(368,248,435,315)(小数点以下切り捨て)
同様に,元のテストチャート画像1002において評価文字「1」を含む領域に対応する読み取り画像1005上の領域を特定する座標は(501,248,701,315)となる。これらの座標の情報は,その座標によって特定される領域に含まれる評価文字と関連付けられて読み取り画像領域情報として読み取り画像領域記憶部122に記憶される。
次いで,図7に示すように,画像切り出し部116が領域記憶部120に記憶されている各領域情報に含まれる座標の情報に基づいてテストチャート画像から任意の領域の画像を切り出す。また,画像切り出し部116は,読み取り画像領域記憶部122に記憶されている各読み取り画像領域情報に含まれる座標の情報に基づいて読み取り画像から任意の領域の画像を切り出す。切り出される画像には,各々ひとつの評価文字が含まれている。画像切り出し部116は,切り出した一組の画像を拡大または縮小するなどしてサイズを調整し,また2値化を行うなどした後に,その一組の画像と,各画像に含まれる評価文字の情報(「0」や「1」など)を評価対象データ出力部118に提供する。評価対象データ出力部118は,テストチャート画像1002からの切り出し画像を改ざん前画像1010とし,読み取り画像1005からの切り出し画像を判定対象画像1012とし,各画像に含まれる評価文字を組み合わせデータ1008として,1セットの評価対象データを出力する。
図8は,改ざん画像作成部124により改ざん画像が作成される処理の流れを示している。図8に示すように,改ざん画像作成部124は,読み取り画像1005と,読み取り画像領域記憶部122に記憶されている読み取り画像領域情報とを用いて改ざん画像を作成する。具体的には,画像切り出し部116によって読み取り画像1005から切り出された画像を,読み取り画像1005上の別の領域に貼り付けることによって改ざん画像1007を作成し,貼り付け先の領域を特定する情報を改ざん領域情報として改ざん領域記憶部126に記憶させる。図示の例によれば,読み取り画像において座標(501,248)および(568,315)によって特定される,「1」が含まれる領域の画像を読み取り画像において座標(368,245)および(435,315)によって特定される「0」が含まれる領域に貼り付けている。そして,貼り付け先の領域の座標(368,245)および(435,315)と,貼り付け前にその領域に含まれていた評価文字「0」および貼り付け後のその領域に含まれる評価文字「1」とが関連付けられて改ざん領域記憶部126に記憶される。各評価文字を含む領域について順次上記の貼り付け処理を行うことによって,読み取り画像1005に含まれている全ての評価文字が入れ替えられた改ざん画像1007を作成することができる。
以上,評価対象データ作成装置10の処理の流れについて説明した。次に,図9および図10に基づいて,本実施形態の比較例にかかる閾値決定装置20の処理の流れについて説明する。
まず,閾値決定装置20の処理の流れを概略的に説明し,その後図9および図10に基づいてより詳細な説明を行う。
閾値決定装置20には,複数の評価対象データおよびパラメータが入力される。特徴量計測部204は,入力された評価対象データ1006に含まれる一組の画像の各々の特徴量を計測する。計測された各画像の特徴量に基づいて,特徴量差分算出部206が特徴量の差分値を算出する。差分値は集計対象データ記憶部208に蓄積され,集計部210は蓄積された差分値に基づいて差分値の度数分布を作成する。度数分布が作成されると,閾値決定部212が,その度数分布と上記パラメータとに基づいて最適な閾値を決定する。以上,処理の流れの概略について説明した。
続いて,詳細な説明を行う。図9に示すように,評価対象データ入力部202によって評価対象データ1006が入力される。入力された改ざん前画像1010と判定対象画像1012は特徴量計測部204に提供され,特徴量計測部204によって各画像の特徴量が計測される。特徴量の計測は,上述のようにガボールフィルタやある特定の形状に強く反応するフィルタ等による画像のフィルタリング処理を行うなどして計測できる。図示の例によれば,改ざん前画像1010の特徴量は7で,判定対象画像1012の特徴量は15である。双方の特徴量が特徴量算出部206に提供され,特徴量算出部206によって差分値が算出される。図示の例によれば,差分値は8である。
その後,算出された差分値は,組み合わせデータ1008とともに集計対象データ2002として集計対象データ記憶部208に格納される。なお,上述のとおり,組み合わせデータ1008に含まれる評価文字(画像特定情報)が同一であるか否かがわかるように集計対象データ記憶部208に記憶されれば,集計対象データ2002に組み合わせデータ1008は含まれていなくても構わない。
複数の評価対象データ1006に対して上述の処理が行われると,図10(a)に示すように複数の集計対象データ2002−1,2002−2,2002−3,…2002−nが集計対象データ記憶部208に蓄積される。集計対象データ2002−1,2002−2は,組み合わせデータ1008に含まれる評価文字が異なる評価対象データから作成された集計対象データの例であり,上述の,評価対象データに含まれる各画像の画像特定情報が同一でない第2グループに対応付けられて記憶されている。一方,集計対象データ2002−3,2002−nは,組み合わせデータ1008に含まれる評価文字が同一である評価対象データから作成された集計対象データの例であり,上述の,評価対象データに含まれる各画像の画像特定情報が同一である第1グループに対応付けられて記憶されている。第1グループに属する集計対象データは,第2グループに属する集計対象データよりも,特徴量差分の値が小さいことがわかる。
複数の集計対象データが蓄積された後,集計部210によって集計対象データの集計が行われ,集計結果として度数分布が作成される。具体的には,第1グループに属する集計対象データの特徴量差分値の度数分布と,第2グループに属する集計対象データの特徴量差分値の度数分布が各々作成される。度数分布は,図10(b)のようなヒストグラムとして表すことができる。また,図10(c)のようなヒストグラムの累積として表してもよい。グラフ中の符号2010は第1グループのヒストグラムであり,符号2012は第2グループのヒストグラムである。なお,図10(c)では,第1グループの方は100%から累積分を減少させている。図10(b),(c)に示すグラフは,テストチャート画像の生成時にフォントの種類として「Times New Roman」,フォントのサイズとして「10.5ポイント」が指定された場合の集計結果を示している。
図10(b),(c)を参照すると,一組の画像の画像特定情報(フォントの種類がTimes New Roman,フォントサイズが10.5ポイントのテキストデータ)が同一である場合,つまり印刷物の読み込み画像に改ざんがされていない場合の特徴量の差分値は,約1.8が最も多く,4より大きい値はほぼ無いことがわかる。一方,一組の画像の画像特定情報が同一でない場合,つまり印刷物の読み込み画像に改ざんがされている場合の特徴量の差分値は,6から10の範囲の値であるものが多く,3より小さい値はほぼ無いことがわかる。閾値決定部212は,作成されたヒストグラムに基づいて閾値を決定する。閾値を決定する方法としては,例えば,改ざん検出装置等による改ざん見逃し率と改ざん誤検出率が等しくなるように閾値を決定する方法を例示できる。第1グループのヒストグラム2010と第2グループのヒストグラム2012が交わる点が,改ざん見逃し率=改ざん誤検出率となる閾値である。また,改ざん検出装置等による改ざん誤検出率が5%以下となるように閾値を設定する方法や,改ざん見逃し率が0.5%以下となるように閾値を設定する方法も考えられる。閾値決定の基準となる改ざん誤検出率や改ざん見逃し率,またはその関係などは,閾値決定部212に予め定められていても良いし,ユーザによりパラメータとして入力されてもよい。
以上,閾値決定装置20の処理の流れについて説明した。以上で,評価対象データ作成装置10と閾値決定装置20によって閾値が決定される処理についての説明を終了する。次に,本実施形態にかかる閾値決定装置30について説明する。閾値決定装置30は,閾値決定装置20と同様に,評価対象データ作成装置10によって作成された評価対象データに基づいて閾値を決定するが,本実施形態では,閾値決定装置30が評価対象データ作成装置10の機能を兼ね備えているものとして説明する。もちろん,閾値決定装置30が備える後述の各機能を複数の装置に分散させて行わせることも可能である。
図11および図12に基づいて,閾値決定装置30の処理の流れについて説明する。なお,上述の評価対象データ作成装置10または閾値決定装置20と同様の機能を備えるものは同一の符号を付することにより説明を省略する。
まず,特徴量計測部204にテストチャート画像1002が入力され(図12のステップS102),特徴量計測部204は,領域記憶部120に記憶されている任意の領域情報に基づいて,その領域情報に含まれる座標によって特定されるテストチャート画像上の領域の特徴量を計測する(S104)。計測された特徴量と領域情報は特徴量埋め込み部302に提供され,特徴量埋め込み部302は,提供された特徴量と領域情報とを関連付けてテストチャート画像1002に電子透かしとして埋め込む(S106)。その後,マーク挿入部104によってテストチャート画像の全領域に電子透かしが埋め込まれ,印刷出力部106によってテストチャート画像が印刷される(S108)。
読み取り部108は,印刷出力部によって印刷された印刷物3004を読み取り,読み取り画像を作成する(S110)。作成された読み取り画像から,抽出部304が,埋め込まれている情報,すなわち特徴量と,その特徴量が計測された領域情報と,を抽出する(S112)。抽出された情報は閾値決定装置30内の記憶領域に保存される。マーク検出部112により,読み取り画像におけるテストチャート画像部分の位置情報が検出される。位置情報算出部314は,マーク検出部112によって検出された位置情報と,抽出部304によって抽出された領域情報とに基づいて,テストチャート画像1002において特徴量を計測された領域に対応する,読み取り画像上の領域を特定する位置情報を算出する。改ざん画像作成部324は,位置情報算出部314によって算出された位置情報によって特定される領域に,他の領域から切り出された画像を貼り付けて改ざん画像を作成する(S114)。
改ざん画像が作成されると,計測領域指定部306が,特徴量を計測する複数の領域を指定する(S116)。具体的には,改ざんされた領域の位置情報(位置情報算出部314によって算出された位置情報)に基づいて,その位置情報によって特定される領域と,その領域の近傍であって同じサイズの領域を複数指定する。特徴量計測部204は,計測領域指定部306によって指定された複数の領域の各々の特徴量を計測する(S118)。特徴量差分算出部206は,特徴量計測部204による計測結果である複数の特徴量の各々と,抽出部304によって読み取り画像から抽出された特徴量との差分値を求める。閾値決定部312は,特徴量差分算出部206によって算出された複数の差分値のなかで,最小の値に基づいて閾値を決定する(S120)。具体的には,特徴量差分算出部206は,最小の差分値を上述の集計対象データ記憶部208に記憶させる。上述の集計部210は,最小の差分値が集計対象データとして複数蓄積された集計対象データ記憶部208の記憶内容に基づいて,上述のように度数分布を作成する。閾値決定部312は,上述のように,作成された度数分布に基づいて閾値を決定する。または,閾値決定部312は,特徴量差分算出部206によって算出された最小の差分値をそのまま閾値としてもよい。以上,閾値決定装置30の処理の流れの概略を説明した。
続いて,図13から17に基づいて,閾値決定部30が行う特徴的な処理を詳細に説明する。図13に示すように,抽出部304は,読み取り画像3005から,埋め込まれている特徴量と領域情報を抽出し,特徴量と,その特徴量が計測された領域の位置情報とを関連付けて特徴量領域情報として特徴量領域記憶部320に記憶させる。位置情報算出部314は,マーク検出部112によって検出された透かし領域の位置情報と,特徴量領域情報とに基づいて,読み取り画像における対応領域の位置情報を算出し,読み取り画像領域情報として読み取り画像領域記憶部322に記憶させる。図示の例によれば,テストチャート画像上の座標(200,200)および(300,300)によって特定される領域の画像の特徴量は7.0であり,その領域は,読み取り画像上では座標(368,248)および(435,315)によって特定される領域である。
改ざん画像作成部324は,任意の読み取り画像領域情報によって特定される領域に,他の読み取り画像領域情報によって特定される領域から切り出した画像を貼り付け,改ざん画像を作成する。図示の例によれば,座標(368,248)および(435,315)によって特定される領域に,画像特定情報として「4」を含む領域の画像が貼り付けられ,改ざん領域記憶部326には貼り付け先の領域の座標が格納される。
その後,計測領域指定部306が,読み取り画像から特徴量を計測する複数の領域を指定する。計測領域指定部306は,図14に示すように,テストチャート画像において特徴量が計測された領域(a)と対応する読み取り画像上の領域であって,改ざんされた領域(b)と,改ざんされた領域の近傍の領域(c)〜(d)を特徴量の計測対象領域に指定する。特徴量計測部204が,指定された各々の領域の画像から特徴量を計測し,特徴量差分算出部206が,計測された各々の特徴量と,改ざん領域記憶部326に格納されている,抽出部304によって読み取り画像から抽出された特徴量との差分値を求める。
特徴量差分算出部206によって算出される差分の値は,計測領域指定部306によって指定された複数の領域のうち,どの領域の画像の特徴量との差分であるかによって相違する。図15は,テストチャート画像において特徴量が計測された領域(図14(a))の画像から計測された特徴量と,対応する読み取り画像上の領域(図14(b))の画像から計測された特徴量との差分値を示している。図示の例によれば,前者の特徴量は4.0で,後者の特徴量は8.4であり,差分値は4.4である。図16は,テストチャート画像において特徴量が計測された領域(図14(a))の画像から計測された特徴量と,計測領域指定部306によって指定された複数の領域(図14(c)〜(d)等)の画像から計測された特徴量との差分値を示している。図を参照すると,双方の画像に含まれる画像特定情報「1」または「4」が離れているほど差分値が大きく,重なっている部分が多いほど差分値が小さいことがわかる。図示の例によれば,最小の差分値は2.2であり,閾値決定部312は,差分の最小値である2.2を閾値として決定する。
または,最小値の2.2が集計対象データとして集計対象データ記憶部208に蓄積され,閾値決定部312はそれらの集計対象データに基づいて作成された度数分布に従って閾値を決定する。差分の最小値に基づいて作成されるヒストグラムを,図17(b)に示した。図17(a)は,図10(c)と同じである。図17(a)と図17(b)とを比較すると,図17(b)では,ヒストグラム2010と2012の双方とも図17(a)よりも小さい値に度数が分布していることがわかる。従って,かかるヒストグラムに基づいて閾値決定部310が閾値を決定した場合,同一の条件(改ざん誤検出率5%以下,等)であっても,図17(a)のヒストグラムに基づいて閾値を決定する場合よりも閾値が小さい値に決定される。閾値が小さい値であれば,改ざん検出装置等が改ざんを見逃す確率は低くなる。
閾値決定装置30を上記構成にすることによって,閾値決定装置30は,相違点が少なくなるように巧妙に画像が改ざんされた場合であっても,改ざん検出装置等が改ざんを見逃すことが無いような適切な閾値を決定することができる。
なお,上記では,ステップS104において印刷前のテストチャート画像の任意の領域の画像から計測された特徴量を,ステップS106でテストチャート画像に電子透かしとして埋め込むように説明したが,本発明にはかかる例には限定されない。例えば,上記のように閾値決定装置30自身がテストチャート画像の任意の領域の画像から特徴量を計測するのであれば,計測された特徴量を,各領域情報と関連付けて領域記憶部120に記憶しておけば,特徴量差分算出部206は領域記憶部120に記憶されている特徴量を参照することによって差分値の算出を行うことができる。なお,閾値決定装置30以外の装置がテストチャート画像の任意の領域の画像から特徴量を計測するのであれば,上述のように特徴量がテストチャート画像に埋め込まれることによって,テストチャート画像が印刷された印刷物を読み取った閾値決定装置30は,読み取り画像自体から特徴量を抽出できるため便利である。ただし,その場合でも,テストチャート画像に特徴量が埋め込まれていなくても,閾値決定装置30は,外部記録媒体や通信網を介して,計測された特徴量を取得することが可能である。
以上,閾値決定装置30について説明した。次に,改ざん検出装置40について説明する。本実施形態にかかる改ざん検出装置40は,印刷前の元画像の任意の領域の画像から計測された特徴量と,印刷物の読み込み画像の対応領域の画像から計測された特徴量とを比較して,読み込み画像の対応領域の画像が改ざんされているか否かを判定する装置である。改ざん有無の判定には,閾値決定装置30によって決定された閾値を使用する。
まず,図18および図19に基づいて,改ざん検出装置40の処理の流れについて概略的に説明する。なお,上述の閾値決定装置30と同様の機能を備えるものは同一の符号を付することにより説明を省略する。
まず,特徴量計測部204に元画像1002が入力され(図19のステップS202),特徴量計測部204は,元画像上の任意の領域の特徴量を計測する(S204)。元画像は,改ざん検出を行う対象の読み取り画像の元となる画像である。計測された特徴量と,その特徴量が計測された領域を特定する位置情報は特徴量埋め込み部302に提供され,特徴量埋め込み部302は,提供された特徴量と位置情報とを関連付けて元画像4002に電子透かしとして埋め込む(S206)。その後,マーク挿入部104によって元画像の全領域に電子透かしが埋め込まれ,印刷出力部106によって元画像が印刷される(S208)。
読み取り部108は,印刷出力部によって印刷された印刷物4004を読み取り,読み取り画像を作成する(S210)。作成された読み取り画像から,抽出部304が埋め込まれている情報,すなわち特徴量と,その特徴量が計測された位置情報と,が抽出される(S212)。抽出された情報は改ざん検出装置40内の記憶領域に保存される。マーク検出部112により,読み取り画像における元画像部分の位置情報が検出される。位置情報算出部314は,マーク検出部112によって検出された位置情報と,抽出部304によって抽出された位置情報とに基づいて,元画像4002において特徴量を計測された領域に対応する,読み取り画像上の領域を特定する位置情報を算出する。
計測領域指定部306は,特徴量を計測する複数の領域を指定する(S214)。具体的には,位置情報算出部314によって算出された位置情報に基づいて,その位置情報によって特定される領域と,その領域の近傍であって同じサイズの領域を複数指定する。特徴量計測部204は,計測領域指定部306によって指定された複数の領域の各々の特徴量を計測する(S216)。特徴量差分算出部206は,特徴量計測部204による計測結果である複数の特徴量の各々と,抽出部304によって読み取り画像から抽出された特徴量との差分値を求める。判定部402は,特徴量差分算出部206によって算出された複数の差分値のなかで,最小の値に基づいて改ざん有無を決定する(S218)。具体的には,最小の差分値と,閾値とを比較して,差分値が閾値よりも小さければその領域の画像は改ざんされていないと判定し,差分値が閾値以上であれば,改ざんされていると判定する。以上,改ざん検出装置40の処理の流れの概略を説明した。
続いて,図20から図23に基づいて,改ざん検出装置40が行う処理を詳細に説明する。図20に示すように,抽出部304は,読み取り画像4005から,埋め込まれている特徴量と位置情報を抽出し,特徴量と,その特徴量が計測された領域の位置情報とを関連付けた特徴量領域情報として特徴量領域記憶部320に記憶させる。位置情報算出部314は,マーク検出部112によって検出された透かし領域の位置情報と,特徴量領域情報とに基づいて,読み取り画像における対応領域の位置情報を算出し,読み取り画像領域情報として読み取り画像領域記憶部322に記憶させる。図示の例によれば,元画像上の座標(200,200)および(300,300)によって特定される領域の画像の特徴量は7.0であり,その領域は,読み取り画像上では座標(368,248)および(435,315)によって特定される領域である。
しかし,位置情報算出部314によって算出された上記位置情報によって特定される領域が,元画像において特徴量を計測された領域に正確に対応する領域とはならない場合がある。例えば,元画像が印刷された印刷物の折り目や皺,または印刷物の読み取り時の読み取り方向のずれなどが原因で,印刷物の読み取り画像において元画像が回転していたり,歪んでいたりする場合がある。そのような場合には,読み取り画像における元画像の開始位置およびサイズ比に従って算出された位置情報によって特定される領域は,元画像において特徴量を計測された領域とは正確に対応せず,位置のずれが生じ,微妙に異なることとなる。そうすると,読み取り画像が改ざんされていなくても,読み取り画像中の対応領域とは位置がずれている領域の画像の特徴量は,抽出部304によって抽出された元画像中の特徴量の値と大きく相違する可能性がある。従って,その状態で改ざん有無の判定を行うと,特徴量の差が閾値を超え,実際は改ざんされていないにもかかわらず改ざんされていると判定してしまう。
図21に例を示した。図示の例によれば,元画像の任意の領域として画像特定情報「0」を含む領域が指定されており,その領域の画像の特徴量は7.0である。読み取り画像は改ざんされておらず,位置情報算出部314によって算出される対応領域には,元画像の任意の領域と同じ「0」が画像特定情報として含まれている。しかし,印刷物の皺等により位置のずれが生じたため,算出された位置情報によって特定される領域は,元画像中の特徴量が計測された領域とは正確に対応しない。そのため,算出された位置情報によって特定される領域の画像(判定対象画像)は,図示のように「0」の位置が元画像に比べて右上にずれている。そのような判定対象画像の特徴量は図示の例によれば4.7であり,元画像の特徴量(7.0)と判定対象画像の特徴量(4.7)との差分値は2.3となる。従って,閾値が2.0であれば,改ざん検出装置40は判定対象画像を改ざん有りと判定してしまい,改ざん誤検出を行うこととなる。そこで,改ざん検出装置40は,そのような改ざん誤検出を防止するため,上記の位置ずれを考慮して特徴量の計測,改ざん有無の判定を行う。以下,詳細に説明する。
位置情報算出部314によって読み取り画像における対応領域の位置情報が算出されると,計測領域指定部306が,読み取り画像から特徴量を計測する複数の領域を指定する。計測領域指定部306は,図22に示すように,元画像において特徴量が計測された領域(a)と対応する読み取り画像上の領域であって,位置情報算出部314によって算出された位置情報により特定される領域(b)と,その領域の近傍の領域(c)〜(d)を特徴量の計測対象領域に指定する。特徴量計測部204が,指定された各々の領域の画像から特徴量を計測し,特徴量差分算出部206が,計測された各々の特徴量と,読み取り画像領域記憶部322に格納されている,抽出部304によって読み取り画像から抽出された特徴量との差分値を求める。
特徴量差分算出部206によって算出される差分の値は,計測領域指定部306によって指定された複数の領域のうち,どの領域の画像の特徴量との差分であるかによって相違する。図23は,元画像において特徴量が計測された領域(図22(a))の画像から計測された特徴量と,計測領域指定部306によって指定された複数の領域(図22(c)〜(d)等)の画像から計測された特徴量との差分値を示している。図を参照すると,双方の画像に含まれる画像特定情報「0」が離れているほど差分値が大きく,重なっている部分が多いほど差分値が小さいことがわかる。図示の例によれば,最小の差分値は0.7であり,判定部402は,差分の最小値である0.7と閾値を比較することによって改ざん有無の判定を行う。
改ざん検出装置40を上記構成にすることによって,印刷物の折り目や皺,スキャナでの印刷物の読み取り時の方向のずれなどによって読み取り画像上における元画像に回転や歪みがある場合でも,改ざん検出装置40が改ざんの誤検出を行う可能性が低減される。
なお,上記では,ステップS204において印刷前の元画像の任意の領域の画像から計測された特徴量を,ステップS206で元画像に電子透かしとして埋め込むように説明したが,本発明はかかる例には限定されない。例えば,上記のように改ざん検出装置40自身が元画像の任意の領域の画像から特徴量を計測するのであれば,計測された特徴量を,各位置情報と関連付けて装置内の記憶領域に記憶しておけば,特徴量差分算出部206は記憶領域に記憶されている特徴量を参照することによって差分値の算出を行うことができる。なお,改ざん検出装置40以外の装置が元画像の任意の領域の画像から特徴量を計測するのであれば,上述のように特徴量が元画像に埋め込まれることによって,元画像が印刷された印刷物を読み取った改ざん検出装置40は,読み取り画像自体から特徴量を抽出できるため便利である。ただし,その場合でも,元画像に特徴量が埋め込まれていなくても,改ざん検出装置40は,外部記録媒体や通信網を介して,計測された特徴量を取得することが可能である。
本実施形態にかかる改ざん検出システムは,上記閾値決定装置30と上記改ざん検出装置40が備えられることによって,改ざんの見逃しおよび改ざんの誤検出を最小限に抑え,適切な改ざんの検出を行うことができる。
以上,添付図面を参照しながら本発明の好適な実施形態について説明したが,本発明は係る例に限定されないことは言うまでもない。当業者であれば,特許請求の範囲に記載された範疇内において,各種の変更例または修正例に想到し得ることは明らかであり,それらについても当然に本発明の技術的範囲に属するものと了解される。