本発明の実施の形態を図面に基づいて以下に説明する。図1は本実施の形態における画像照合装置101の構成を示すブロック図である。この画像照合装置101は、例えば図2に示すデジタルカラー複写機(画像データ出力処理装置)102に備えられる。
画像照合装置101が処理対象とする書類(原稿)は、特に特定されるものではないが、画像照合装置101は、画像同士の類似性を判定する機能を有しており、予め画像を登録できるようになっており、登録された画像と、処理すべく入力された原稿の画像との類似性を判定可能な構成である。
以下、予め登録されている原稿の画像を登録画像と称し、コピーやファクシミリ、或いはファイリング等の画像照合装置101にて処理するために入力された原稿の画像を入力画像と称する。
画像照合装置101は、登録画像と処理すべく入力された入力画像との類似性を判定して、判定結果を示す判定信号を出力するものである。本実施形態の画像照合装置101では、入力画像データ増が登録画像に類似していると判定すると、出力する判定信号により、入力画像の画像データに対する出力処理(カラー複写機では画像形成処理)を禁止したり、画質を低下させたり、あるいは、画像データのファイリングといった、出力処理を制御するようになっている。
画像照合装置101は、図1に示すように、制御部1、文書照合部(形状類似性判定部)2、色類似性判定部4、類似性総合判定部5、及びメモリ(記憶手段)3を備えている。
上記文書照合部2は、入力された画像データより画像の形状に関する特徴を示す形状特徴量を抽出して、登録されている登録画像の形状特徴量と比較し、上記入力された入力画像と上記登録画像との類似性を判定するものである。判定結果は、類似性総合判定部5に出力される。また、本実施形態では、文書照合部2には登録画像を登録する機能も付加されており、登録するための画像データも入力される。
上記文書照合部2は、特徴点算出部11、特徴量算出部12、投票処理部13、文書類似度判定処理部14及び登録処理部15を備えている。
特徴点算出部11は、入力画像や登録画像の画像データが入力されると、該入力画像データより文字列や罫線の連結部分を抽出し、連結部分の重心を特徴点として算出する。本実施形態では、特徴点算出部11は、各特徴点の座標も算出する。
特徴量算出部(形状特徴量算出部)12は、特徴点算出部11にて算出された特徴点を用いて、回転、拡大、縮小に対して不変な量、すなわち原稿画像の回転、平行移動、拡大縮小を含む幾何学的変化に対して不変なパラメータである特徴量(ハッシュ値)を算出する。特徴量を計算するために注目特徴点の近傍の特徴点を選択して用いる。この特徴量が、画像の形状に関する特徴を示す形状特徴量である。
投票処理部13は、照合モードで、特徴点算出部11が入力画像の画像データより算出した各特徴点について特徴量算出部12が算出したハッシュ値を用いて、後述するハッシュテーブルに登録されている登録画像に対して投票するものである。投票処理部13は、入力画像の画像データのハッシュ値と同じハッシュ値を有する登録画像に投票する。
文書類似度判定処理部14は、投票処理部13の投票処理結果より、入力画像が登録画像に類似するか否かを判定するものである。なお、本発明における形状類似度算出部は、これら投票処理部13と文書類似度判定処理部14とで構成される。
登録処理部15は、登録モードにおいて、特徴点算出部11が登録画像データより算出した各特徴点について特徴量算出部12が算出したハッシュ値に応じて、登録画像を表すIDを登録するものである。
なお、上記文書照合部2において、上記投票処理部13及び文書類似度判定処理部14は、照合モードで処理を実施し、登録モードでは、処理を実施しない。逆に登録処理部15は、登録モードで処理を実施し、照合モードでは処理を実施しない。
上記色類似性判定部4は、入力された画像データより画像の色に関する特徴を示す色特徴量を抽出して、登録されている登録画像の色特徴量と比較し、上記入力された入力画像と上記登録画像との類似性を判定するものである。判定結果は、類似性総合判定部5に出力される。また、本実施形態では、色類似性判定部4には登録画像を登録する機能も付加されており、登録するための画像データも入力される。本実施形態では、色特徴量として、色相を用いているが、色相に限られるものではない。
上記色類似性判定部4は、色相情報抽出部41、色相類似度判定処理部42、彩度判定処理部43、及び色相情報登録処理部44を備えている。
色相情報抽出部(色相抽出部)41は、画像データより色相情報を抽出するものである。色相類似度判定処理部(色相類似性判定部)42は、照合モードにおいて、色相情報抽出部41より抽出された色相情報と、登録画像の色相情報とを比較して、入力画像と登録画像とが類似するか否かを判定するものである。
彩度判定処理部(彩度判定部)43は、照合モードにおいて、入力画像の画像データより彩度情報を算出し、算出した彩度情報より入力画像が「有彩」であるか「無彩」であるかを判定するものである。
色相情報登録処理部44は、登録モードにおいて、色相情報抽出部41にて抽出された色相情報を、登録画像を表すIDに関連つけて登録するものである。
なお、上記色類似性判定部4において、上記色相類似度判定処理部42は、照合モードで処理を実施し、登録モードでは処理を実施しない。逆に色相情報登録処理部44は、登録モードで処理を実施し、照合モードでは処理を実施しない。
類似性総合判定部5は、照合モードにおいて、文書類似度判定処理部14、色相類似度判定処理部42の判定結果に基づいて、入力画像と登録画像との類似性(類似度)を決定するものである。本実施形態では、彩度判定処理部43の判定結果も用いるようになっている。
制御部(CPU)1は、画像照合装置101における上記各部及びメモリ3へのアクセスを制御するものである。また、メモリ3は、画像照合装置101における上記各部が処理を実施する場合の作業用メモリであると共に、また、登録処理にて、登録される画像を表すインデックス(ID;画像を識別するためのもの)等、各種の情報が登録される場所である。
以下、図面を用いて、画像照合装置101各部を詳細に説明する。まず、画像照合装置101における文書照合部2から説明する。
文書照合部2における特徴点算出部11は、図3に示すように、特徴点算出部11は、無彩化処理部21、解像度変換部22、MTF処理部23、2値化処理部24及び重心算出部25を備えている。図3は特徴点算出部11の構成を示すブロック図である。
無彩化処理部21は、登録画像や入力画像等の画像データである入力画像データがカラー画像であった場合に、入力画像データを無彩化して明度もしくは輝度信号に変換する。例えば、下記式(1)より輝度Yを求める。
なお、無彩化処理は、上式による方法に限定されず、RGB信号をCIE1976L*a*b*信号(CIE : Commission International de l'Eclairage、 L*: 明度指数、a*, b*:色度指数)に変換するものであっても良い。
解像度変換部22は、入力画像データが画像入力装置で光学的に変倍されていた場合に、所定の解像度になるように入力画像データを再度変倍する。上記画像入力装置は、例えば、原稿の画像を読み取って画像データに変換するスキャナであり、図2に示すデジタルカラー複写機ではカラー画像入力装置111がそれに相当する。
また、解像度変換部22は、後段でのデータ処理量を軽減するために、画像入力装置により等倍の設定にて読み込まれる解像度よりも解像度を落とすための解像度変換部としても用いられる。例えば、600dpi(dot per inch)で読み込まれた画像データを300dpiに変換する。
MTF処理部23は、画像入力装置の空間周波数特性が画像入力装置の種類ごとに異なることによる影響を吸収するために用いられる。すなわち、画像入力装置が備えるCCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果及び操作むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけたものとなっている。そこで、MTF処理部23は、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後段の特徴量算出部12の特徴点抽出部31での処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタを用いて強調及び平滑化処理を行う。なお、この混合フィルタのフィルタ係数は、例えば図4に示すものである。
2値化処理部24は、無彩化処理部21にて無彩化された画像データの輝度値(輝度信号)または明度値(明度信号)を閾値と比較することにより画像データを2値化し、この2値化した画像データ(登録画像、入力画像の2値画像データ)をメモリ3に格納する。
重心算出部25は、2値化処理部24において2値化された画像データ(例えば、「1」、「0」で表される画像データ)の各画素に対してラベリング(ラベル付け処理)を行う。このラベリングにおいては2値のうちの同一の値を示す画素に同一のラベルを付与する。次に、同一ラベルを付した画素を連結して形成された複数画素からなる領域である連結領域を特定する。次に、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部12へ出力する。ここで上記特徴点は、2値画像における座標値(x座標、y座標)で表すことができ、特徴点の座標値も算出して、特徴量算出部12へ出力する。
図5は、2値化された画像データから抽出された連結領域及びこの連結領域の重心の一例を示す説明図であり、「A」という文字に対応する連結領域及びその連結領域の重心(特徴点)を示している。また、図6は、2値化された画像データに含まれる文字列から抽出された複数の連結領域の各重心(特徴点)の一例を示す説明図である。
特徴量算出部12は、図7に示すように、特徴点抽出部31、不変量算出部32及びハッシュ値算出部33を備えている。図7は特徴量算出部12の構成を示すブロック図である。
特徴点抽出部31は、特徴点算出部11にて算出された特徴点が画像データにおいて複数存在する場合に、1つの特徴点を注目特徴点とし、この注目特徴点の周辺の特徴点を、注目特徴点からの距離が近いものから順に所定数だけ周辺特徴点として抽出する。図8の例では、上記所定数を4点とし、特徴点aを注目特徴点とした場合に特徴点b,c,d,eの4点が周辺特徴点として抽出され、特徴点bを注目特徴点とした場合には特徴点a,c,e,fの4点が周辺特徴点として抽出される。
また、特徴点抽出部31は、上記のように抽出した周辺特徴点4点の中から選択し得る3点の組み合わせを抽出する。例えば、図9(a)〜図9(d)に示すように、図8に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点b,d,e、周辺特徴点c,d,eの各組み合わせが抽出される。
不変量算出部32は、特徴点抽出部31において抽出された各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出する。
ここで、iは注目特徴点を示す数(iは1以上の整数)であり、jは周辺特徴点3点の組み合わせを示す数(jは1以上の整数)である。本実施形態では、周辺特徴点同士を結ぶ線分の長さのうちの2つの比を不変量Hijとする。
上記線分の長さは、各周辺特徴点の座標値に基づいて算出できる。例えば、図9(a)の例において、特徴点bと特徴点cとを結ぶ線分の長さをA11、特徴点bと特徴点dとを結ぶ線分の長さをB11とすると、不変量H11は、H11=A11/B11である。また、図9(b)の例において、特徴点bと特徴点cとを結ぶ線分の長さをA12、特徴点bと特徴点eとを結ぶ線分の長さをB12とすると、不変量H12は、H12=A12/B12である。また、図9(c)の例において、特徴点bと特徴点dとを結ぶ線分の長さをA13、特徴点bと特徴点eとを結ぶ線分の長さをB13とすると、不変量H13は、H13=A13/B13である。また、図9(d)の例において、特徴点cと特徴点dとを結ぶ線分の長さをA14、特徴点cと特徴点eとを結ぶ線分の長さをB14とすると、不変量H14は、H14=A14/B14である。このようにして、図9(a)〜図9(d)の例では、不変量H11,H12,H13,H14が算出される。
なお、上記の例では、注目特徴点に最も近い周辺特徴点と2番目に近い周辺特徴点とを結ぶ線分をAij、注目特徴点に最も近い周辺特徴点と3番目に近い周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
ハッシュ値算出部33は、例えば、
Hi=(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/D
という式における余りの値をハッシュ値(特徴量の1つ)Hiとして算出し、得られたハッシュ値メモリ8に格納する。なお、上記Dは余りが取り得る値の範囲をどの程度に設定するかに応じて予め設定される定数である。
上記不変量Hijの算出方法は特に限定されるものではない。例えば、注目特徴点の近傍5点の複比、近傍n点(nはn≧5の整数)から抽出した5点の複比、近傍n点から抽出したm点(mは、m<nかつm≧5の整数)の配置、及びm点から抽出した5点の複比に基づいて算出される値などを注目特徴点についての上記不変量Hijとしてもよい。なお、複比とは、直線上の4点または平面上の5点から求められる値であり、幾何学的変換の一種である射影変形に対する不変量として知られている。
また、ハッシュ値Hiを算出するための式についても上記の式に限るものではなく、他のハッシュ関数(例えば特許文献2に記載されているハッシュ関数のうちのいずれか)を用いてもよい。
特徴量算出部12の各部は、1つの注目特徴点に対する周辺特徴点の抽出及びハッシュ値Hiの算出が終わると、注目特徴点を他の特徴点に変更して周辺特徴点の抽出及びハッシュ値の算出を行い、全ての特徴点についてのハッシュ値を算出する。
図8の例では、特徴点aを注目特徴点とした場合の周辺特徴点及びハッシュ値の抽出が終わると、次に特徴点bを注目特徴点とした場合の周辺特徴点及びハッシュ値の抽出を行う。なお、図8の例では、特徴点bを注目特徴点とした場合、特徴点a,c,e,fの4点が周辺特徴点として抽出される。
そして、図10(a)〜図10(d)に示すように、これら周辺特徴点a,c,e,fの中から選択される3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点a,e,c、周辺特徴点a,f,c、周辺特徴点e,f,c)を抽出し、各組み合わせについてハッシュ値Hiを算出し、メモリ3に格納する。そして、この処理を各特徴点について繰り返し、各特徴点を注目特徴点とした場合のハッシュ値をそれぞれ求めてメモリ3に記憶させる。
また、特徴量算出部12は、登録処理を行う場合には、上記のように算出した入力画像データ(登録画像の画像データ)の各特徴点についてのハッシュ値(特徴量)を登録処理部15に送る。
登録処理部15は、特徴量算出部12が算出した各特徴点についてのハッシュ値と、当該入力画像データの登録画像を表すIDとをメモリ3に設けられた図示しないハッシュテーブルに順次登録していく(図11(a)参照)。ハッシュ値がすでに登録されている場合は、当該ハッシュ値に対応付けてIDを登録する。IDは重複することなく順次番号が割り当てられる。
なお、ハッシュテーブルに登録されている登録画像の数が所定値(例えば、登録可能な原稿の数の80%)より多くなった場合、古いIDを検索して順次消去するようにしてもよい。また、消去されたIDは、新たな入力画像データのIDとして再度使用できるようにしてもよい。また、算出されたハッシュ値が同値である場合(図11(b)の例ではH1=H5)、これらを1つにまとめてハッシュテーブルに登録してもよい。
また、特徴量算出部12は、照合処理を行う場合には、上記のように算出した入力画像データ(入力画像の画像データ)の各特徴点についてのハッシュ値を投票処理部13に送る。
投票処理部13は、入力画像データから算出した各特徴点のハッシュ値をハッシュテーブルに登録されているハッシュ値と比較し、同じハッシュ値を有する登録画像に投票する(図12参照)。図12は、3つの登録画像ID1,ID2,ID3に対する投票数の一例を示すグラフである。言い換えれば、投票処理部13は、登録画像毎に、登録画像が有するハッシュ値と同じハッシュ値が入力画像データから算出された回数をカウントし、カウント値をメモリ3に記憶させる。
また、図11(b)の例では、H1=H5であり、これらをH1の1つにまとめてハッシュテーブルに登録されているが、このようなテーブル値において、入力画像データから算出した入力画像の有するハッシュ値にH1があった場合は、登録画像ID1には、2票投票される。
文書類似度判定処理部14は、投票処理部13の投票処理結果より、最大の得票数を得た登録画像のID及び得票数を抽出し、抽出された得票数を予め定められている閾値と比較して文書類似度Llを算出する、或いは、抽出された得票数をその原稿が有している最大得票数で除算して正規化し、その結果と予め定められている閾値とを比較して文書類似度Llを算出する。
この場合の閾値の例としては、例えば、0.8以上に設定する方法が挙げられる。手書き部分があると、投票数は最大得票数より大きくなることがあるため、類似度は1より大きくなる場合もあり得る。
最大得票数は、特徴点の数×1つの特徴点(注目特徴点)から算出されるハッシュ値の数で表される。前述した図8、図9、図10の例では、最も簡単な例として、1つの特徴点から1つのハッシュ値が算出される例を示しているが、注目特徴点の周辺の特徴点を選択する方法を変えると、1つの特徴点から複数のハッシュ値を算出することができる。例えば、注目特徴点の周辺の特徴点として6点抽出し、この6点から5点を抽出する組み合わせは6通り存在する。そして、これら6通りそれぞれについて、5点から3点を抽出して不変量を求めハッシュ値を算出する方法が挙げられる。
本実施の形態では、文書類似度判定処理部14にて算出された文書類似度Llは、類似性総合判定部5へと出力される。
次に、画像照合装置101における色類似性判定部4について説明する。色類似性判定部4は、前述したように、色相情報抽出部41、色相類似度判定処理部42、彩度判定処理部43、及び色相情報登録処理部44を備えている。
色相情報抽出部41は、登録画像や入力画像等の画像データである入力画像データがカラー画像であった場合に、入力画像データのRGBデータをCIE1976L*a*b*信号(CIE: Commission International de l’Eclairage :国際照明委員会。L*: 明度、a*、b*: 色度)に変換する。そして、例えば、下記式(2)より色相情報Hを求める。
なお、色相情報を抽出する処理は、上式による方法に限定されず、例えばL*a*b*信号ではなく、CIE1976L*u*v*信号(CIE: Commission International de l’Eclairage :国際照明委員会。L*: 明度指数、u*、v*: クロマティクネス指数)を用いても良く、それぞれの色空間での色相情報を求めるようにしても良いし、他の簡略な色相情報を求める方法を使っても良い。
色相情報抽出部41は、算出した色相情報にて、例えば、10刻み36段階(すなわち、色相角が36度毎の色相)のヒストグラム(以下、色相ヒストグラム)を作成する。
色相情報登録処理部44は、登録モードにおいて、色相情報抽出部41にて作成されたこの色相ヒストグラムを、登録画像を表すIDに関連つけてメモリ3に格納する。なお、照合モードでは、色相情報登録処理部44をスルーする。
色相類似度判定処理部42は、照合モードにおいて、色相情報抽出部41にて作成された色相ヒストグラムと、登録画像の色相ヒストグラムとを比較して、入力画像と登録画像とが類似するか否かを判定するものである。
このとき、色相類似度判定処理部42は、全ての登録画像の色相ヒストグラムを抽出するのではなく、文書照合部2の文書類似度判定処理部14の照合結果を参照して、形状特徴量的に類似性を有する登録画像について、その色相ヒストグラムを抽出する。
文書類似度判定処理部14の照合結果を参照して、形状特徴量の比較にて類似性を有する登録画像を特定する処理は、例えば、閾値を設けておき、閾値以上の類似度を有する登録画像を全て抽出するようにしてもよく、また、閾値と抽出数を決めておき、閾値以上の高い類似度を示す登録画像を所定数抽出するようにしても良い。
そして、色相類似度判定処理部42は、色相情報のヒストグラムを用いて色相類似度を、例えば、以下のようにして求める。
すなわち、色相類似度Lhとすると、Lhを、入力画像の色相ヒストグラムHg=(b1、b2、・・・b36)と、登録画像の色相ヒストグラムHgr=(br1,br2,・・・br36)とから、以下の式(3)で計算する。
色相類似度Lhは、値が小さいほど類似度は高いと考えられる。色相類似度判定処理部42で算出された色相類似度Lhは、類似性総合判定部5へと出力される。
なお、色相類似度判定処理部42は、文書類似度判定処理部14にて、類似する登録画像がないと判定されている場合は、以降の処理をキャンセルする。
一方、色相情報抽出部41にて、CIE1976L*a*b*信号(CIE: Commission International de l’Eclairage :国際照明委員会。L*: 明度、a*、b*: 色度)に変換された、登録画像や入力画像等の画像データは、彩度判定処理部43にも送られる。
彩度判定処理部43は、照合処理において、上記CIE1976L*a*b*信号より、彩度情報Sを以下の式(4)より求める。
なお、上記は彩度情報Sを求めるための一例であって、例えばL*u*v*信号を用いても良く、あるいは、RGB信号より、以下の式(5)を用いて簡易に彩度に相当する値を求めるようにしても良い。
彩度判定処理部43は、例えば、算出された彩度情報Sより入力画像の全画素について平均を求めて、求めた平均値と閾値(例えば、最大彩度の10%)を比較して、閾値よりも平均値が小さい場合には、入力画像は「無彩」と判定する。また、逆の場合には、「有彩」と判定する。
次に、画像照合装置101における類似性総合判定部5について説明する。類似性総合判定部5には、文書照合部2の文書類似度判定処理部14より文書類似度Llが入力され、また、色類似性判定部4の色相類似度判定処理部42より色相類似度Lhが、色類似性判定部4の彩度判定処理部43より「有彩」或いは「無彩」の何れかの情報が入力される。
類似性総合判定部5は、文書類似度Ll、色相類似度Lhについては、それぞれについて予め指定した閾値よりも値が大きければ類似度が高く、低ければ類似度が低いと判定する。
文書類似度Llについては、類似度が高いと判断する閾値は、例えば最大類似度の90%に設定される。一方、色相類似度Lhにおいては、類似度が高いと判断する閾値は、例えば最大類似度の90%に設定される。
また、類似性総合判定部5には、例えば、図13に示すような関係が規定されており、文書類似度Ll、色相類似度Lh、及び「有彩」或いは「無彩」の情報をもとに、総合的に類似性を判定類似度を決定する。
図13よりわかるように、文書類似度Llが低く色相類似度Lhが高い場合と、文書類似度Llが高く色相類似度Lhが低い場合とでは、文書類似度Llが高く色相類似度Lhが低い場合の方を、登録画像との類似性が高いと判定するようになっている。
画像の形状特徴量による類似性の判定結果を画像の色特徴量による類似性の判定結果よりも優先させることで、逆を優先させるよりも、登録画像と入力画像との類似性をより精度よく判定することができる。
また、類似性総合判定部5は、文書類似度Llが同程度であり、色相類似度Lhが同程度に低い2つの画像がある場合、入力画像の彩度判定の結果より、無彩である場合を有彩である場合よりも高く判定するようになっている。
ここで、このように入力画像が無彩である場合を有彩よりも高く判定する理由について説明する。
形状特徴量による判定と色特徴量による判定とを組み合わせて総合的に登録画像と入力原稿との類似性を判定する場合、形状特徴量による類似性が同程度でかつ色相による類似性が同程度に低い値を示す2つの画像は、どちらも同程度に登録画像に類似していないと判定される。
具体例挙げて説明すると、例えば、赤い色の文字や罫線で構成された画像に対して、形状特徴量による判定では類似すると判定される、緑色の文字や罫線で構成された画像と黒色の文字・罫線で構成された画像の2枚の画像は、色相による類似性の判定では、どちらも赤い色の文字や罫線で構成された画像に同程度類似していないと判定される。
しかしながら、実際には、カラー画像のオリジナル画像を白黒コピーしたりファクシミリ送信したりして、無彩色の非オリジナル画像として利用したりすることが多くある。また、前述した申請書のように、よく似たレイアウトの文書画像(形状特徴量による類似性が高い)に、異なる色の文字と罫線が使用されている文書画像も多い。さらに、カラーの原稿をもともとの色から別の有彩の色に変換して使用するということはほとんど考えられない。
したがって、先程の例であれば、黒色の文字・罫線の原稿のほうが、緑色の文字・罫線の原稿よりも類似度が高いと判定するほうが、文書画像の使用状況を勘案した類似性の判定になる。
そのため、本実施形態では、上述したように、類似性総合判定部5は、文書類似度Llが同程度であり、色相類似度Lhが同程度に低い2つの画像がある場合、入力画像の彩度判定の結果より、無彩である場合を有彩である場合よりも高く判定するようになっている。
これにより、上記のようなカラー画像のオリジナルが白黒コピーされたりファクシミリ送信されたりして形成された無彩色の非オリジナル画像や、レイアウトは似ているが異なる色の文字と罫線が用いられている前述の申請書のような画像について、使用者の感覚に合った判定が可能になり、精度の高い判定が可能になる。
なお、図13に示したような、関係を規定したテーブルを備えさせる以外にも、予め上記2つの類似度(文書類似度Llと色相類似度Lh)とから統合した類似度を計算する式を定めておき計算するようにしても良い。その場合、色相類似度Lhの値が予め定めた閾値よりも低い場合には、彩度判定の結果を参照して、無彩の場合のほうが類似度が高くなるように補正すればよい。
次に、上記の画像照合装置101を備えるデジタルカラー複写機102の構成について説明する。図2はデジタルカラー複写機102の構成を示すブロック図である。
図2に示すように、デジタルカラー複写機102は、カラー画像入力装置111、カラー画像処理装置112及びカラー画像出力装置113、及び操作パネル114を備えている。
カラー画像入力装置111は、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部より構成され、原稿からの反射光像を、RGBのアナログ信号として出力する。
カラー画像入力装置111にて読み取られたアナログ信号は、カラー画像処理装置112内を、A/D変換部121、シェーディング補正部122、画像照合部123、入力階調補正部124、領域分離処理部125、色補正部126、黒生成下色除去部127、空間フィルタ処理部128、出力階調補正部129、及び階調再現処理部130の順で送られ、CMYKのデジタルカラー信号として、カラー画像出力装置113へ出力される。
A/D変換部121は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部122では、A/D変換部121より送られてきたデジタルのRGB信号に対して、カラー画像入力装置111の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。また、カラーバランスを整えると同時に、濃度信号などカラー画像処理装置112に採用されている画像処理システムの扱い易い信号に変換する処理を施す。
画像照合部123は、入力された入力画像データの画像、予め登録されている登録画像との類似度を判定してその結果を出力するもので、図1の画像照合装置101に相当する。また、画像照合部123は、入力された画像データのRGBデータはそのまま後段の入力階調補正部124へ出力する。また、画像照合部123は、求めた類似度判定結果(判定信号)を出力し、これを受けて、操作パネル114が、類似すると判定された画像を一覧表示したり、後段の処理部が処理を変更したりする。例えば、コピー、電子配信、ファイリングの禁止や所定のアドレスへの電子配信やフォルダへのファイリングなどを行う。
入力階調補正部124では、シェーディング補正部122にて各種の歪みが取り除かれたRGB信号に対して、下地濃度の除去やコントラストなどの画質調整処理が施される。
領域分離処理部125は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域の何れかに分離するものである。領域分離処理部125は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部127、空間フィルタ処理部128、及び階調再現処理部130へと出力すると共に、入力階調補正部124より出力された入力信号をそのまま後段の色補正部126に出力する。
色補正部126では、色再現の忠実化を図るために、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
黒生成下色除去部127は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これによりCMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部128は、黒生成下色除去部127より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより出力画像のぼやけや粒状性劣化を軽減することができる。
階調再現処理部129では、空間フィルタ処理部と同様に、CMYK信号の画像データに対して、領域識別信号に基づいて後述する所定の処理が施される。
例えば、領域分離処理部125にて文字に分離された領域は、文字の再現性を高めるために、空間フィルタ処理部128における空間フィルタに高周波成分の強調量が大きいフィルタが用いられる。同時に、階調再現処理部130においては、高域周波成分の再現に適した高解像度のスクリーンによる二値化もしくは多値化処理が実施される。
また、領域分離処理部125にて網点に分離された領域に関しては、空間フィルタ処理部128において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部129では、濃度信号などの信号をカラー画像出力装置113の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部130で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理が施される。領域分離処理部125にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
上述した各処理が施された画像データは、一旦、図示しない記憶装置に記憶され、所定のタイミングで読み出されてカラー画像出力装置113に入力される。
このカラー画像出力装置113は、画像データを紙などの記録媒体上に出力するもので、例えば、電子写真方式やインクジェット方式を用いたカラー無像出力装置等をあげることができるが特に限定されるものでは無い。なお、以上の処理は図示しないCPU(Central Processing Unit)により制御される。
上記の構成において、本実施の形態の画像照合装置101の動作を、図14、図15のフローチャートに基づいて以下に説明する。
図14は、登録モードにおけるフローチャートである。登録モードの選択は、デジタルカラー複写機102では、操作パネル114の操作により選択される。画像照合装置101とこれに接続された端末装置(コンピュータ)とを備えた画像処理システムでは、端末装置からの入力操作等により選択される。
制御部1は、登録すべき登録画像の画像データが入力されると、形状特徴量を抽出して登録する処理と、色特徴量である色相情報算出を算出して色相ヒストグラムを作成して登録する処理とを、並行して実施する。なお、並行処理に限らず、順次処理する構成としてもよい。
形状特徴量を抽出して登録する処理においては、特徴点算出部11が、入力画像データに基づいて、登録される画像の各特徴点を算出し(S1)、特徴量算出部12が、特徴点算出部11にて算出された各特徴点の特徴量を算出し(S2)、登録処理部15が、登録される画像の上記特徴点の特徴量(ハッシュ値)、登録される画像を表すインデックス(ID)をメモリ3のテーブルに格納する(S3)。
一方、色特徴量である色相情報を抽出して色相ヒストグラムを作成して登録する処理では、色相情報抽出部41が、入力画像データに基づいて、登録される画像の色相情報を抽出し、色相ヒストグラムを作成し(S4)、色相情報登録処理部44が、登録される画像の色相ヒストグラム、登録画像を表すインデックス(ID)をメモリ3のテーブルに格納する(S5)。以上の処理を行うと、制御部1は、登録モードを終了する。
図15は、照合モードにおけるフローチャートである。コピーや、ファクシミリ送信、ファイリング等、原稿画像を画像照合装置101にて読み取らせ、何らかの処理を実施させようとしたときに、処理モードに入る。
制御部1は、処理すべき入力画像の画像データが入力されると、形状特徴量を抽出して照合する処理と、色特徴量である色相情報算出を算出して色相ヒストグラムを作成して照合する処理とを、並行して実施する。なお、並行処理に限らず、順次処理する構成としてもよい。
形状特徴量を抽出して照合する処理においては、特徴点算出部11が、入力画像データに基づいて、入力画像の各特徴点を算出し(S11)、特徴量算出部12が、特徴点算出部11にて算出された各特徴点の特徴量を算出し(S12)、投票処理部13が、算出された入力画像の特徴量を用いて投票処理を行う(S13)。
次に、文書類似度判定処理部14が、投票処理の結果に基づいて、入力画像が何れかの登録画像に類似するか否かを判断する(S14)。ここで、どの登録画像にも類似しない場合は、文書類似度判定処理部14は、判定信号「0」を出力し(S15)する。一方、何れかの登録画像に類似する場合は、文書類似度LIを出力する(S16)。
一方、色特徴量である色相情報を抽出して色相ヒストグラムを作成して照合する処理では、色相情報抽出部41が、入力画像データに基づいて、入力画像の色相情報を抽出し、色相ヒストグラムを作成し(S21)、色相類似度判定処理部42が、作成された入力画像の色相ヒストグラムと、メモリ3のテーブルより取得した登録画像の色相ヒストグラムとを比較し、色相類似度を算出する(S22)。ここで、色相類似度判定処理部42は、文書類似度判定処理部14の判定結果を参照し、形状特徴量による判定で類似性があると判定された登録原稿の色相ヒストグラムを抽出する。
次いで、彩度判定処理部43が、入力画像データに基づいて、入力画像が有彩であるか無彩であるかを判定し(S23)、色相類似度判定処理部42及び彩度判定処理部43が、色相類似度と彩度の判定結果を出力する(S24)。
類似性総合判定部5は、入力される文書類似度Ll及び色相類似度Lh、並びに有彩、無彩の情報を基にして、入力画像と登録画像との類似性を総合的に判定し(S25)、判定信号を出力する(S26)。なお、本実施形態では、類似性総合判定部5は、入力される文書類似度Ll及び色相類似度Lh、並びに有彩、無彩の情報を基にして、総合的な判定として、類似度を8段階で示すようになっているので、この類似度を判定信号として出力する。
上記のように、本実施の形態の画像照合装置101では、入力された画像データより画像の形状に関する特徴を示す形状特徴量を抽出して、登録されている登録画像の形状特徴量と比較し、上記入力された入力画像と上記登録画像との類似性を判定すると共に、入力された画像データより画像の色に関する特徴を示す色特徴量を抽出して、登録画像の色特徴量と比較し、上記入力画像と上記登録画像との類似性を判定し、さらに、入力画像の彩度を抽出して彩度の情報を加えて、上記入力画像と上記登録画像との類似性を判定するようになっている。
これにより、入力画像と登録画像とが、形状特徴量による類似性の判定では識別できなかった、文字や罫線の色が異なる構成要素がよく似た申請書等のカラー画像同士であっても、精度よく類似性を判定することができる。
同様に、入力画像と登録画像とが、色特徴量による類似性の判定では識別できなかった、色目が似たカラー画像同士であったり、登録画像がカラー画像で、入力画像が、これを白黒コピーしたりファクシミリ送信したりして形成された白黒画像であっても、精度よく類似性を判定することができる。
そして、画像の構成要素と色情報に加えて、彩度の情報を用いて判定することで、前述した、形状(文字および罫線の形状)に関する類似度が共に同程度の、赤い罫線の原稿と、緑の形成の原稿と、黒い罫線の原稿との3枚について、1)赤い罫線の原稿と緑の罫線の原稿と、2)赤い罫線の原稿と黒い罫線の原稿とでは、1)よりも2)の方が類似度が高いといった、より現実の使い方にあった判定を実施できる。
これにより、オリジナル画像がカラー画像である場合に、これをコピーしたりして形成された非オリジナル画像との類似性を、精度よく判定することが可能になる。
また、このような類似度の判定を、画像の検索に使用して、求めた類似度の順序に従って画像をソートして表示するようにすることで、オリジナルのカラー画像が、白黒コピーされたりファクシミリ送信したりした画像を、形状的特徴がよく似た全く別のカラー原稿よりも高い順位にて表示することが可能となる。
図16は、本実施形態の画像照合装置101が備えられるデジタルカラー複合機(画像データ出力処理装置)104の構成を示すブロック図である。
デジタルカラー複合機104は、図2に示したデジタルカラー複写機102に対して、例えばモデムやネットワークカードよりなる通信装置115を追加した構成である。
このデジタルカラー複合機104では、ファクシミリの送信を行う場合、通信装置115にて相手先との送信手続きを行い、送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリ3から読み出し、圧縮形式の変更など必要な処理を施した後、その画像データを通信回線を介して相手先に順次送信する。
また、ファクシミリの受信を行う場合、通信手続きを行いながら相手先から送信されてくる画像データを受信してカラー画像処理装置116に入力する。カラー画像処理装置116では、受信した画像データに対して圧縮/伸張処理部(図示せず)にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正(出力階調補正部131)、階調再現処理(階調再現処理部132)が施され、カラー画像出力装置113から出力される。
また、デジタルカラー複合機104は、ネットワークカード、LANケーブルを介して、ネットワークに接続されたコンピュータや他のデジタル複合機とデータ通信を行なう。
また、上記の例では、デジタルカラー複合機104について説明したが、この複合機はモノクロの複合機であっても構わない。また、単体のファクシミリ通信装置であっても構わない。
また、本実施の形態の画像照合装置101は、画像読取装置にも適用可能である。図17は、本実施の形態の画像照合装置101を適用したカラー画像読取装置(画像データ出力処理装置)105の構成を示すブロック図である。このカラー画像読取装置105は例えばフラットベッドスキャナであり、デジタルカメラであってもよい。
カラー画像読取装置105は、カラー画像入力装置111とカラー画像処理装置117とを備え、カラー画像処理装置117は、A/D変換部121、シェーディング補正部122、画像照合部123を備えている。画像照合部123’、図1に示した画像照合装置101に相当する。
カラー画像入力装置111(画像読取手段)は、例えばCCD(Charge Coupled Device )を備えたスキャナ部より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてCCDにて読み取って、カラー画像処理装置117に入力するものである。
カラー画像入力装置111にて読み取られたアナログ信号は、カラー画像処理装置117内を、A/D(アナログ/デジタル)変換部121、シェーディング補正部122、画像照合部123’の順で送られる。
A/D変換部121は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部122は、A/D変換部121より送られてきたデジタルのRGB信号に対して、カラー画像入力装置111の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。シェーディング補正部122ではカラーバランスの調整を行い、またRGBの反射率信号を濃度信号に変換する。
画像照合部123’の機能は、画像照合装置101において前述したとおりである。画像照合部123’では、入力された画像データと登録画像との類似度を判定してその結果(判定信号:コピー、電子配信、ファイリングの禁止や所定のアドレスへの電子配信やフォルダへのファイリング否など)を出力する。判定信号は、読み込まれた画像データとともにネットワークを介してプリンタや複合機に送信され出力される。あるいは、コンピュータを介してプリンタに、もしくは、直接プリンタに入力さる。この場合、プリンタや複合機、コンピュータ側で処理内容を表す信号を判断できるようにしておく必要がある。上記判定信号を出力するのではなく、算出した入力画像の形状特徴量及び色特徴量(色相情報)、彩度を出力し、サーバやコンピュータ、プリンタ側で、登録されている登録画像と照合判定を行うようにしても良い。画像読取装置としてデジタルカメラを用いても良い。
本発明はコンピュータに実行させるためのプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体に、上記した類似性判定(画像照合)及び出力制御を行う画像処理方法を記録するものとすることもできる。この結果、類似性判定部並びに出力制御、原稿画像の登録処理を行う画像処理方法を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるためにメモリ(図示せず)、例えばROMそのものがプログラムメディアであっても良いし、また、外部記憶装置(図示せず)としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
何れの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、何れの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータのプログラム記憶エリア(図示せず)にダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
また、コンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置およびコンピュータの処理結果を紙などに出力するプリンタより構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。