〔実施形態1〕
本発明の一実施形態について説明する。なお、本実施形態では、本発明をデジタルカラー複合機(MFP:Multi-Function Printer)に適用する場合の一例について説明する。
(1−1. デジタルカラー複合機1の構成)
図2は、本実施形態にかかるデジタルカラー複合機(画像処理装置、画像形成装置、画像読取装置)1の概略構成を示すブロック図である。このデジタルカラー複合機1は、コピー機能、プリンタ機能、ファクシミリ送信機能、スキャナ機能、scan to e-mail機能等を有している。
図2に示すように、デジタルカラー複合機1は、カラー画像入力装置2、カラー画像処理装置3、カラー画像出力装置4、通信装置5、操作パネル6を備えている。
カラー画像入力装置(画像読取装置)2は、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてカラー画像処理装置3に出力する。
カラー画像処理装置3は、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、および階調再現処理部20を備えている。カラー画像入力装置2からカラー画像処理装置3に出力されたアナログ信号は、カラー画像処理装置3内を、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、階調再現処理部20の順で送られ、CMYKのデジタルカラー信号としてカラー画像出力装置4に出力される。
A/D(アナログ/デジタル)変換部11は、RGBのアナログ信号をデジタル信号に変換するものである。
シェーディング補正部12は、A/D変換部11より送られてきたデジタルのRGB信号に対して、カラー画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。また、シェーディング補正部12は、カラーバランスの調整、および濃度信号などカラー画像処理装置3に採用されている画像処理システムの扱い易い信号に変換する処理を施す。
文書照合処理部13は、入力された画像データから特徴点を抽出し、抽出した特徴点に基づいて特徴量を算出する。また、文書照合処理部13は、上記のように算出した特徴量を画像データと対応付けて後述するハッシュテーブルに記憶(登録)させる。また、文書照合処理部13は、入力画像データから上記のように算出した特徴量をハッシュテーブルに記憶されている登録画像の特徴量と比較することで入力画像と登録画像との類似性を判定する。また、文書照合処理部13は入力されたRGB信号をそのまま後段の入力階調補正部14へ出力する。なお、文書照合処理部13の詳細については後述する。
入力階調補正部14は、シェーディング補正部にて各種の歪みが取り除かれたRGB信号に対して、下地色(下地色の濃度成分:下地濃度)の除去やコントラストなどの画質調整処理を施す。
領域分離処理部15は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域のいずれかに分離するものである。領域分離処理部15は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、および階調再現処理部20へと出力するとともに、入力階調補正部14より出力された入力信号をそのまま後段の色補正部16に出力する。
色補正部16は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。階調再現処理部20も、空間フィルタ処理部18と同様、CMYK信号の画像データに対して領域識別信号を基に所定の処理を施すものである。
例えば、領域分離処理部15にて文字に分離された領域は、特に黒文字あるいは色文字の再現性を高めるために、空間フィルタ処理部18による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、階調再現処理部20においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。
また、領域分離処理部15にて網点領域に分離された領域に関しては、空間フィルタ処理部18において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部19では、濃度信号などの信号をカラー画像出力装置4の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部20で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離処理部15にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
上述した各処理が施された画像データは、いったん記憶装置(図示せず)に記憶され、所定のタイミングで読み出されてカラー画像出力装置4に入力される。
カラー画像出力装置4は、カラー画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。カラー画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いたカラー画像出力装置を用いることができる。
通信装置5は、例えばモデムやネットワークカードより構成される。通信装置5は、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバー装置、他のデジタル複合機、ファクシミリ装置等)とデータ通信を行う。
なお、通信装置5は、画像データを送信する場合、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更など必要な処理を施して、通信回線を介して相手先に順次送信する。
また、通信装置5は、画像データを受信する場合、通信手続きを行うとともに、相手先から送信されてくる画像データを受信してカラー画像処理装置3に入力する。受信した画像データは、カラー画像処理装置3で伸張処理、回転処理、解像度変換処理、出力階調補正、階調再現処理などの所定の処理が施され、カラー画像出力装置4によって出力される。なお、受信した画像データを記憶装置(図示せず)に保存し、カラー画像処理装置3が必要に応じて読み出して上記所定の処理を施すようにしてもよい。
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理要求(例えば処理モード(複写、印刷、送信、編集など)、処理枚数(複写枚数、印刷枚数)、入力画像データの送信先など)を入力することができる。上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
(1−2. 文書照合処理部13の構成)
次に、文書照合処理部13の詳細について説明する。本実施形態にかかる文書照合処理部13は、入力画像データから複数の特徴点を抽出し、抽出した各特徴点に対して局所的な特徴点の集合を決定し、決定した各集合から特徴点の部分集合を選択し、選択した各部分集合を特徴付ける量として、部分集合中の特徴点に関する複数の組み合わせに基づいて、幾何学的変換に対する不変量をそれぞれ求め、求めた各不変量を組み合わせてハッシュ値(特徴量)を算出する。また、計算したハッシュ値に対応する登録画像に投票することにより、入力画像データに類似する登録画像の検索、当該登録画像に対する類似性の判定処理(類似あり/類似なしの判定)を行う。また、計算したハッシュ値と、このハッシュ値を抽出した画像とを対応付けてハッシュテーブルに記憶(登録)させる処理を行うこともできる。
図1は、文書照合処理部13の概略構成を示すブロック図である。この図に示すように、文書照合処理部13は、前処理部30、特徴点算出部(特徴点検出部)31、特徴量算出部32、投票処理部33、類似度判定処理部34、登録処理部37、制御部7、メモリ8を備えている。
制御部7は、文書照合処理部13の各部の動作を制御する。なお、制御部7は、デジタルカラー複合機1の各部の動作を制御するための主制御部に備えられていてもよく、主制御部とは別に備えられ、主制御部と協働して文書照合処理部13の動作を制御するものであってもよい。
メモリ8には、登録画像を特定するためのインデックスと、登録画像から抽出した特徴量とを互いに対応付けて記憶するハッシュテーブル103が備えられている。また、メモリ8には、ハッシュテーブル103の他、文書照合処理部13の各部の処理に用いられる各種データ、処理結果等を記憶する記憶部(図示せず)を備えている。なお、ハッシュテーブル103の詳細については後述する。
図3は、前処理部30の概略構成を示すブロック図である。この図に示すように、前処理部30は、傾き検知部41、傾き補正処理部42、信号変換処理部(無彩化処理部)43、解像度変換部44、MTF処理部45を備えている。
傾き検知部41は、入力画像の傾き(入力画像データの縦方向・横方向に対する、この入力画像データ中の原稿画像の縦方向・横方向の傾き)を検知する処理を行う。傾きの検知方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。
例えば、図4に示すように、入力画像データにおけるx方向の中心(スキャナで読み取られる領域におけるx方向の中心)からx方向両側にw/2だけ離れた2点で原稿の端部(エッジ)e1,e2、および入力画像データの端部E1,E2を検出する。そして、原稿の端部e1から入力画像データのE1までのy方向に沿った距離d1、原稿の端部e2から入力画像データのE2までのy方向に沿った距離d2、および原稿の端部e1からe2までのx方向に沿った距離wとに基づいてtanθ=(d2−d1)/wを算出し、傾き角度θを算出する。傾き角度θの算出方法は特に限定されるものではないが、例えば図5に示すような正接−角度テーブルを用いることによって容易に算出できる。
なお、原稿のエッジを抽出する方法としては、例えば、図4に示すようにエッジ計測ウィンド内の輝度値を投影して求める方法を用いることができる。具体的には、図6に示すように、所定の大きさ(ここではx方向20画素×y方向150画素)のエッジ計測ウィンド内の入力画像データに対してエッジ強調フィルタ処理(エッジ強調処理)を施してエッジ強調画像を得る。図7はエッジ検知用フィルタの一例である。そして、エッジ強調画像に対して、縦方向(y方向)のエッジを検出するために、横方向(x方向)の画素値の合計を求める投影処理を行い、縦方向のピークをとる位置(例えば最小値)を求める。投影処理(ウィンド内におけるx方向に並ぶ各画像の輝度値を合計する処理)を行うのは、ノイズの影響を抑えるためである。図8は投影結果を示すグラフである。
傾き補正処理部42は、傾き検知部41の検出した傾き角度θに基づいて入力画像データにおける原稿の傾きを補正する。傾き補正処理の方法は特に限定されるものではないが、例えば回転行列を用いたアフィン変換処理などを用いることができる。
一般に、座標(x,y)をθ回転させた座標(x’,y’)は、下記の式(1)に示す回転行列式で表すことができる。
画像の画素値として出力する場合には、整数値(x’,y’)に対応する小数値(xs,ys)を算出し、これをバイリニア等で補間演算すればよい。小数値(xs,ys)は、上記の回転行列式の逆変換式である下記の式(2)に示す行列式によって算出される。
x−y座標系において、(xs,ys)を取り囲む4点の画素の座標は、図9に示すように、(xi,yj)、(xi+1,yj)、(xi,yj+1)、(xi+1,yj+1)で表される(i,jは1以上の整数)。ここで、xi≦xs<xi+1、yj≦ys<yj+1である。そして、上記4つの画素の値をそれぞれ(xi,yj):Z1、(xi+1,yj):Z2、(xi,yj+1):Z3、(xi+1,yj+1):Z4とし、xiとxsとのx方向についての距離と、xsとxi+1とのx方向についての距離との比をu:1−u、yjとysとのy方向についての距離と、ysとyj+1とのy方向についての距離との比をv:1−vとすると、バイリニアによる補間後の座標値Zは、Z(x’,y’)=Z(xs,ys)=(1−v){(1−u)Z1+u・Z2}+v{(1−u)Z3+u・Z4}で表される。なお、三角比の演算方法については特に限定されるものではないが、例えば上述した図5の例と同様、テーブルを用いて行ってもよい。
信号変換処理部43は、シェーディング補正部12から入力された画像データ(RGB信号)がカラー画像であった場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。
例えば、信号変換処理部43は、下記式によりRGB信号を輝度信号Yに変換する。
Yi=0.30Ri+0.59Gi+0.11Bi
ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
あるいは、RGB信号をCIE1976L*a*b*信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよい。
解像度変換部44は、入力画像データを変倍処理する。例えば、解像度変換部44は、入力画像データがカラー画像入力装置2で光学的に変倍されている場合に、所定の解像度になるように入力画像データを再度変倍する。また、解像度変換部44が、後段の各処理部における処理量を軽減するために、カラー画像入力装置2で等倍時に読み込まれる解像度よりも解像度を落とすための解像度変換を行うようにしてもよい(例えば、600dpi(dot per inch)で読み込まれた画像データを300dpiに変換するなど)。
MTF(modulation transfer function)処理部45は、カラー画像入力装置2の空間周波数特性が機種ごとに異なることを吸収(調整)するために用いられる。CCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果及び操作むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけたものとなっている。MTF処理部45は、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後述する特徴点抽出処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタ(図示せず)を用いて強調および平滑化処理を行う。なお、図10は、この混合フィルタにおけるフィルタ係数の一例を示している。
なお、前処理部30の構成は上記した構成に限るものではなく、例えば、上記各処理に加えて、あるいは上記各処理の一部または全部に代えて、エッジ部分を抽出する微分処理や、アンシャープマスクを用いたノイズ軽減処理、取り扱うデータ量を減らすための2値化処理などを行ってもよい。
図11は、特徴点算出部31の概略構成を示すブロック図である。この図に示すように、特徴点算出部31は、パターン検知処理部46、置換画像生成部47、一致度算出部48、一致度判定部49を備えている。
パターン検知処理部46は、入力画像から注目画素を中心とするL×M画素(L,Mは1以上の整数。L=Mであってもよく、L≠Mであってもよい。)の部分画像を抽出し、部分画像中に有効なパターンが存在するか否かを判定するパターン検知処理を行う。また、パターン検知処理部46は、注目画素を1画素毎に順次ラスター走査することで上記パターン検知処理を各画素について行う。なお、画像の端部において部分画像に含まれる画素数がL×Mに満たない場合には、例えば不足画素分を補うように画像端部を折り返しコピーするなどの処理を行ってもよい。
ここで、パターン検知処理の詳細について説明する。本実施形態では、パターン検知処理部46は、まず、下記式(3)により算出される画像データの煩雑性を示す分散値busyを算出する。なお、下記式(3)において、Nは部分画像の画素数、Iは各画素の信号値、iは各画素を特定するための値(iは1からNまでの整数)を表している。
そして、パターン検知処理部46は、上記のように算出した分散値busyと予め設定された閾値TH1との大小関係を比較することで、パターンの有無を判定する。例えば、busy≧TH1の場合に有効なパターン有りと判定し、busy<TH1の場合に有効なパターン無しと判定する。なお、閾値TH1は、パターンが適切に抽出されるように適宜設定すればよい。また、ここでは、分散値busyを用いる場合について説明したが、これに限らず、例えば、分散値以外の画像の煩雑性を示す指標を用いて判定してもよい。
置換画像生成部47は、パターン検知処理部46においてパターン有りと判定された部分画像を、この部分画像についての自己置換画像(T)を生成する。
ここで、自己置換画像とは、部分画像の一部を当該部分画像における他の一部と所定の方法によって置換した画像である。図12は、入力画像、およびこの入力画像から得られる自己置換画像の一例を示す説明図である。この図に示すように、自己置換画像としては、例えば、縦軸鏡像置換画像、横軸鏡像置換画像、中心点対称置換画像、対角鏡像置換画像などを用いることができる。縦軸鏡像置換画像は、x方向についての中心を通るy方向の直線を軸とする部分画像の鏡像である。横軸鏡像画像は、y方向についての中心を通るx方向の直線を軸とする部分画像の鏡像である。中心点対称置換画像は、入力画像(部分画像)の各画素をこの部分画像の中心点について対称に置換した画像である。対角鏡像置換画像とは、部分画像の対角線を軸とするこの部分画像の鏡像である。
例えば、縦軸鏡像置換画像(I)は、(I)のC列R行を(I)C,Rとすると、(T)C,R=(I)L−C+1,Rを演算することで得ることができる。
一致度算出部48は、入力画像(入力部分画像)と自己置換画像との相関値(正規化相関値;一致度)Sを算出する。
ここで、相関値の算出方法および一致度の判定方法についてより具体的に説明する。一般に、N画素からなる2つの画像Input(I)とTarget(T)との相関値Sは、
で表される。上記式(4)におけるA,B,Cは下記の式(5)〜(7)で表される値である。
なお、自己置換画像として中心点対称置換画像を用いる場合には、B=Cであることは明らかである。したがって、相関値Sは、S=(A/B)×1000を演算すればよく、演算の簡略化を図ることができる。また、上記Bは、上記した分散値busyと同じであるので、算出済みの分散値busyの値を上記Bとして用いればよく、上記Bを再計算する必要はない。
一致度判定部(検出部)49は、一致度算出部48が算出した相関値Sと予め設定された閾値TH_estとを比較することで入力画像と自己置換画像とが一致するか否かを判定する。具体的には、一致度検出部49は、S>TH_estの場合には両画像が一致すると判定し、この部分画像の中心画素(注目画素)を特徴点とする。一方、S≦TH_estの場合には両画像は一致しないと判定する。また、一致度判定部49は特徴点とした画素を示す情報を特徴量算出部32に出力する。あるいは、一致度判定部49は特徴点とした画素を示す情報をメモリ8に記憶させ、特徴量算出部32がメモリ8からこの情報を読み出すようにしてもよい。なお、閾値TH_estは、特徴点が適切に抽出されるように適宜設定しておけばよい。
特徴量算出部32は、特徴点抽出部32a、不変量算出部32b、ハッシュ値算出部32cを備えており、特徴点算出部31で算出された特徴点を用いて、原稿画像の回転、平行移動、拡大、縮小、平行移動等の幾何学的変形に対して不変な量である特徴量(ハッシュ値および/または不変量)を算出する。
特徴点抽出部32aは、図13に示すように、1つの特徴点を注目特徴点とし、この注目特徴点の周辺の特徴点を、注目特徴点からの距離が近いものから順に所定数(ここでは4点)だけ周辺特徴点として抽出する。図13の例では、特徴点aを注目特徴点とした場合には特徴点b,c,d,eの4点が周辺特徴点として抽出され、特徴点bを注目特徴点とした場合には特徴点a,c,e,fの4点が周辺特徴点として抽出される。
また、特徴点抽出部32aは、上記のように抽出した周辺特徴点4点の中から選択しうる3点の組み合わせを抽出する。例えば、図14(a)〜図14(c)に示すように、図13に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点c,d,eの各組み合わせが抽出される。
次に、不変量算出部32bは、抽出した各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出する。ここで、iは注目特徴点を示す数(iは1以上の整数)であり、jは周辺特徴点3点の組み合わせを示す数(jは1以上の整数)である。本実施形態では、周辺特徴点同士を結ぶ線分の長さのうちの2つの比を不変量Hijとする。なお、上記線分の長さは、各周辺特徴点の座標値に基づいて算出すればよい。例えば、図14(a)の例では、特徴点cと特徴点dとを結ぶ線分の長さをA11、特徴点cと特徴点bとを結ぶ線分の長さをB11とすると、不変量H11はH11=A11/B11である。また、図14(b)の例では、特徴点cと特徴点bとを結ぶ線分の長さをA12、特徴点bと特徴点eとを結ぶ線分の長さをB12とすると、不変量H12はH12=A12/B12である。また、図14(c)の例では、特徴点dと特徴点bとを結ぶ線分の長さをA13、特徴点bと特徴点eとを結ぶ線分の長さをB13とすると、不変量H13はH13=A13/B13である。このようにして、図14(a)〜図14(c)の例では、不変量H11,H12,H13が算出される。なお、上記の例では、水平方向左側に位置する周辺特徴点と水平方向中央に位置する周辺特徴点とを結ぶ線分をAij、水平方向中央に位置する周辺特徴点と水平方向右側に位置する周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
次に、ハッシュ値算出部32cは、(Hi1×102+Hi2×101+Hi3×100)/Dの余りの値をハッシュ値(特徴量の1つ)Hiとして算出し、メモリ8に記憶させる。なお、上記Dは余りが取り得る値の範囲をどの程度に設定するかに応じて予め設定される定数である。
なお、不変量Hijの算出方法は特に限定されるものではなく、例えば、注目特徴点の近傍5点の複比、近傍n点(nはn≧5の整数)から抽出した5点の複比、近傍n点から抽出したm点(mはm<nかるm≧5の整数)の配置およびm点から抽出した5点の複比に基づいて算出される値などを注目特徴点についての上記不変量Hijとしてもよい。なお、複比とは、直線上の4点または平面上の5点から求められる値であり、幾何学的変換の一種である射影変形に対する不変量として知られている。
また、ハッシュ値Hiの算出するための式についても上記式、すなわち(Hi1×102+Hi2×101+Hi3×100)/Dの余りの値をハッシュ値とする構成に限るものではなく、他のハッシュ関数(例えば特許文献2に記載されているハッシュ関数のうちのいずれか)を用いてもよい。
また、特徴量算出部32の各部は、1つの注目特徴点に対する周辺特徴点の抽出およびハッシュ値Hiの算出が終わると、注目特徴点を他の特徴点に変更して周辺特徴点の抽出およびハッシュ値の算出を行い、全ての特徴点についてのハッシュ値を算出する。
図13の例では、特徴点aを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出が終わると、次に特徴点bを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出を行う。図13の例では、特徴点bを注目特徴点とした場合、特徴点a,c,e,fの4点が周辺特徴点として抽出される。そして、図15(a)〜図15(c)に示すように、これら周辺特徴点a,c,e,fの中から選択される3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点c,e,f、周辺特徴点a,c,f)を抽出し、各組み合わせについてハッシュ値Hiを算出し、メモリ8に記憶させる。そして、この処理を各特徴点について繰り返し、各特徴点を注目特徴点とした場合のハッシュ値をそれぞれ求めてメモリ8に記憶させる。
なお、特徴点aを注目特徴点としたときの不変量の算出方法は上記の方法に限るものではない。例えば、図26(a)〜図26(d)に示すように、図13に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点b,d,e、周辺特徴点c,d,eの各組み合わせを抽出し、抽出した各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出するようにしても良い。
また、図13に示した特徴点bを注目特徴点とした場合、図27(a)〜図27(d)に示すように、特徴点a,c,e,fの4点の周辺特徴点の中から、ある3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点a,c,e、周辺特徴点a,f,c、周辺特徴点e,f,c)を抽出し、各組み合わせについて幾何学的変形に対する不変量Hijを算出するようにしてもよい。なお、この場合、(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/Dの余りの値をハッシュ値として算出し、メモリ8に記憶させればよい。
また、上記の例では、注目特徴点に最も近い周辺特徴点と2番目に近い周辺特徴点とを結ぶ線分をAij、注目特徴点に最も近い周辺特徴点と3番目に近い周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、周辺特徴点間を結ぶ線分の長さを基準にして選定する等、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
なお、特徴量算出部32は、入力画像データを登録画像として登録する登録処理を行う場合には、上記のように算出した入力画像データの各特徴点についてのハッシュ値(特徴量)を登録処理部37に送る。また、特徴量算出部32は、入力画像データが既に登録されている登録画像の画像データであるかどうかの判定処理(類似性判定処理)を行う場合には、上記のように算出した入力画像データの各特徴点についてのハッシュ値を投票処理部33に送る。
登録処理部37は、特徴量算出部32が算出した各特徴点についてのハッシュ値と、原稿(入力画像データ)を表すインデックス(原稿ID)とを互いに対応付けてメモリ8に設けられたハッシュテーブル103に順次登録していく(図16(a)参照)。ハッシュ値がすでに登録されている場合は、当該ハッシュ値に対応付けて原稿IDを登録する。原稿IDは重複することなく順次番号が割り当てられる。なお、ハッシュテーブル103に登録されている原稿の数が所定値(例えば、登録可能な原稿の数の80%)より多くなった場合、古い原稿IDを検索して順次消去するようにしてもよい。また、消去された原稿IDは、新たな入力画像データの原稿IDとして再度使用できるようにしてもよい。また、算出されたハッシュ値が同値である場合(図16(b)の例ではH1=H5)、これらを1つにまとめてハッシュテーブル103に登録してもよい。
投票処理部33は、入力画像データから算出した各特徴点のハッシュ値をハッシュテーブル103に登録されているハッシュ値と比較し、同じハッシュ値を有する登録画像に投票する。言い換えれば、登録画像毎に、登録画像が有するハッシュ値と同じハッシュ値が入力画像データから算出された回数をカウントし、カウント値をメモリ8に記憶させる。図17は、登録画像ID1,ID2,ID3に対する投票数の一例を示すグラフである。
類似度判定処理部34は、メモリ8から投票処理部33の投票処理結果(各登録画像のインデックスおよび各登録画像に対する投票数;類似度)を読み出し、最大得票数および最大得票数を得た登録画像のインデックスを抽出する。そして、抽出された最大得票数を予め定められている閾値THaと比較して類似性(入力画像データが登録画像の画像データであるかどうか)を判定し、判定結果を示す判定信号を制御部7に送る。つまり、最大得票数が予め定められた閾値THa以上である場合には「類似性あり(入力画像データは登録画像の画像データである)」と判定し、閾値THa未満である場合には「類似性なし(入力画像データは登録画像の画像データではない)」と判定する。
あるいは、類似度判定処理部34が、各登録画像に対する得票数を投票総数(入力画像データから抽出された特徴点の総数)で除算して正規化することで類似度を算出し、この類似度と予め定められている閾値THa(例えば投票総数の80%)との比較を行うことによって類似度を判定してもよい。
また、類似度判定処理部34が、各登録画像に対する得票数を、ハッシュ値の登録数が最も多い登録画像についてのハッシュ値の登録数(最大登録数)で除算して正規化することで類似度を算出し、この類似度と予め定められている閾値THa(例えば投票総数の80%)との比較を行うことによって類似性を判定してもよい。つまり、算出した類似度が閾値THa以上である場合には「類似性あり」と判定し、閾値THa未満である場合には「類似性なし」と判定すればよい。なお、この場合、入力画像データから抽出されるハッシュ値の総数は上記最大登録数よりも大きくなる場合があるため(特に原稿および/または登録画像の少なくとも一部に手書き部分がある場合など)、類似度の算出値は100%を超える場合も有り得る。
また、類似性を判定する際の閾値THaは、各登録画像について一定であってもよく、あるいは各登録画像の重要度等に応じて登録画像毎に設定されてもよい。登録画像の重要度は、例えば、紙幣、有価証券、極秘書類、社外秘の書類等については重要度を最大にし、秘密書類については重要度を紙幣等よりも低くするといったように、登録画像に応じて段階的に設定してもよい。この場合、メモリ8に、登録画像の重要度に応じた重み付け係数を当該登録画像のインデックスと関連付けて記憶させておき、類似度判定処理部34が、最大得票数を得た登録画像に対応する閾値THaを用いて類似性を判定するようにすればよい。
また、類似性を判定する際、閾値THaは一定にする一方、各登録画像に対する投票数(各登録画像の得票数)に各登録画像の重み係数を掛けて類似性を判定するようにしてもよい。この場合、メモリ8に、各登録画像の重要度に応じた重み付け係数を各登録画像のインデックスと関連付けて記憶させておき、類似度判定処理部34が、各登録画像の得票数に当該登録画像の重み付け係数を掛けた補正得票数を算出し、この補正得票数に基づいて類似性を判定するようにすればよい。例えば、最大補正得票数と閾値THaとを比較してもよく、最大補正得票数を投票総数で正規化したものを閾値THaと比較してもよく、最大補正得票数を最大登録数で正規化したものを閾値THaと比較してもよい。また、この場合、重み係数は、例えば、1より大きい値であって、かつ登録画像の重要度が高くなるにつれて大きい値になるように設定すればよい。
また、本実施形態では、1つの特徴点(注目特徴点)に対して1つのハッシュ値を算出するものとしているが、これに限らず、1つの特徴点(注目特徴点)に対して複数のハッシュ値を算出するようにしてもよい。例えば、注目特徴点の周辺特徴点として6点を抽出し、この6点から5点を抽出した6通りの組み合わせそれぞれについて、5点から3点を抽出して不変量を求めてハッシュ値を算出する方法を用いてもよい。この場合には、1つの特徴点に対して6個のハッシュ値が算出されることになる。
(1−3. デジタルカラー複合機1における処理)
次に、デジタルカラー複合機1における処理について、図18に示すフロー図を参照しながら説明する。
まず、制御部7は、入力画像データ、および、操作パネル6あるいは通信装置5を介してユーザから入力される処理要求(指示入力)を取得する(S1、S2)。なお、入力画像データは、カラー画像入力装置2で原稿画像を読み取ることによって取得してもよく、通信装置5によって外部の装置から送信される入力画像データを取得してもよく、デジタルカラー複合機1に備えられるカードリーダー(図示せず)等を介して各種記録媒体から入力画像データを読み出して取得してもよい。
次に、制御部7は、前処理部30に入力画像データに対する前処理(例えば、傾き検知処理、傾き補正処理、無彩化処理、解像度変換処理、MTF処理)を実行させ(S3)、特徴点算出部31に特徴点算出処理を実行させ(S4)、特徴量算出部32に特徴量を算出させる(S5)。なお、特徴点算出処理の詳細については後述する。
次に、制御部7は、上記処理要求によって要求されている処理が登録処理であるか否かを判断する(S6)。そして、登録処理であると判断した場合、制御部7は、特徴量算出部32が算出した特徴量と原稿ID(登録画像のID)とを対応付けてハッシュテーブル103に登録させ(S7)、処理を終了する。
一方、登録処理ではないと判断した場合(類似性の判定処理であると判断した場合)、制御部7は、投票処理部33に投票処理を実行させ(S8)、類似度判定処理部34に類似性の判定処理を実行させる(S9)。
そして、類似ありと判定した場合には、入力画像データに対する画像処理(例えば、複写、印刷、電子配信、ファクシミリ送信、ファイリング、画像データの補正,編集等の処理)の実行を禁止し(S10)、処理を終了する。また、類似なしと判定した場合には、入力画像データに対する画像処理の実行を許可し(S11)、処理を終了する。なお、本実施形態では、類似ありの場合に画像処理の実行を許可し、類似なしの場合に画像処理の実行を禁止する例について説明しているが、これに限るものではない。例えば、類似性の判定結果を所定の通知先への通知するようにしてもよい。また、類似性の判定結果に応じて入力画像データの記録の要否、入力画像データに対応する出力画像に所定の記号等を重畳させることの要否、ユーザ認証を行うことの要否、類似性判定結果の表示の要否などを判断するようにしてもよい。
図19は、特徴点算出部31における特徴点算出処理(上記S4の処理)の流れを示すフロー図である。
この図に示すように、前処理部30から特徴点算出部31に入力画像データが入力されると、制御部7は、パターン検知処理部46に部分画像(例えばL×Mの部分画像)を抽出させ(S21)、パターン検知処理を実行させる(S22)。そして、制御部7は、パターン検知処理の結果に基づいて部分画像中に有効なパターンが存在するか否かを判断する(S23)。
そして、有効なパターンが存在すると判断した場合、制御部7は、置換画像生成部47にS21で抽出した部分画像の自己置換画像を生成させる(S24)。次に、制御部7は、一致度算出部48に、S21で抽出した部分画像とS24で生成した自己置換画像との一致度を算出させる(S25)。さらに、制御部7は、一致度判定部49に、部分画像と自己置換画像とが一致するか否かを判定させる(S26)。
そして、制御部7は、S26において部分画像と自己置換画像とが一致すると判定された場合、この部分画像における中心画素(注目画素)を特徴点としてメモリ8に登録する(S27)。あるいは、上記部分画像における中心画素(注目画素)を特徴点とすることを示す情報を特徴点算出部31に出力する。
また、制御部7は、S27の処理の後、あるいはS23において有効なパターンが存在しないと判断した場合、あるいはS26において部分画像と自己置換画像とが一致しないと判定された場合、入力画像データにおける全画素に対してパターン検知処理を行ったか否かを判断する(S28)。すなわち、入力画像データにおける全画素をそれぞれ注目画素とする各部分画像について、パターン検知処理を行ったか否かを判断する。
そして、パターン検知処理を行っていない画素が残っている場合には、注目画素をラスター走査し、次の注目画素についてS22以降の処理を行う(S29)。一方、全画素についてパターン検知処理を行ったと判断した場合、制御部7は特徴点算出処理を終了する。
以上のように、本実施形態にかかるデジタルカラー複合機1の文書照合処理部13では、入力画像データから部分画像を抽出し、抽出した部分画像にパターンが含まれるか否かを判定し、パターンが含まれる場合には上記部分画像と、この部分画像の自己置換画像とが一致するか否かを判定する。そして、一致する場合に、この部分画像における注目画素を特徴点として抽出する。
これにより、入力画像データが拡大,縮小等の処理が施されたデータである場合であっても、上記拡大,縮小等の影響を受けない部分画像(あるいは拡大,縮小等の影響が小さい部分画像)の中心点(注目画素)を特徴点として抽出することができる。つまり、上記拡大,縮小等にかかわらず、同じパターンの特徴点を精度よく抽出でき、算出された特徴点間の距離の比率は不変なものとなる。
また、入力画像データに含まれる罫線などの線分、あるいはこれらの線分の交点等、多くの点を特徴点として抽出することが可能となる。また、上記特許文献1のように、特徴点を抽出する際に原稿の構成要素(文字部分、文字枠、線、枠など)を切り分ける必要が無いので、アルゴリズムおよび装置構成の簡略化を図ることができる。
図20は、縮小処理が施された部分画像とこの部分画像から生成される縦軸鏡像置換画像、拡大処理が施された部分画像とこの部分画像から生成される縦軸鏡像置換画像の一例を示す説明図である。この図に示すように、部分画像とこの部分画像の自己置換画像との一致度に基づいて特徴点を抽出することで、入力画像データに対して拡大処理や縮小処理が施されている場合であっても、拡大,縮小処理が施されていない場合と同様、同じパターンの特徴点を精度よく抽出することが可能となる。
したがって、このように抽出した特徴点に基づいて算出される特徴量に基づいて画像の類似度を算出することにより、上記拡大,縮小等にかかわらず入力画像と登録画像との類似性を精度よく判定できる。
また、本実施形態にかかるデジタルカラー複合機1の文書照合処理部13は、入力画像データの傾き(入力画像データの縦方向・横方向に対するこの入力画像データ中の原稿画像の縦方向・横方向の傾き)を検知する傾き検知部41と、傾き検知部41の検知結果に基づいて入力画像データの傾きを補正する傾き補正処理部42とを備えている。したがって、例えば、入力画像データ中における原稿画像が傾斜している場合(例えば、画像読取装置の読取位置における所定の配置角度に対して原稿が傾斜して配置された状態で読み取られた場合など)でも、傾斜がない場合と同様、同じパターンの特徴点を精度よく抽出することが可能となる。したがって、このように抽出した特徴点に基づいて算出される特徴量に基づいて画像の類似度を算出することにより、上記傾斜,拡大,縮小等にかかわらず入力画像と登録画像との類似性を精度よく判定できる。
また、本実施形態では、上記のように抽出された各特徴点に対して局所的な特徴点の集合を決定し、決定した各集合から特徴点の部分集合を選択し、選択した各部分集合を特徴付ける量として、部分集合中の特徴点に関する複数の組み合わせに基づいて、幾何学的変換に対する不変量をそれぞれ求め、求めた各不変量を組み合わせてハッシュ値(特徴量)を算出する。これにより、入力画像と登録画像との類似性をより精度よく判定できる。
また、上記の構成によれば、部分画像を抽出し、抽出した部分画像とこの部分画像の少なくとも一部を当該部分画像における他の一部と置換させた自己置換画像とが一致するか否か(自己相関があるか否か)を判定するだけで特徴点を容易に抽出することができるので、特徴点算出部31の回路構成を簡略化し、ハード化を容易にすることができる。
また、一般に、手書き文字は自己置換画像に対する一致度(自己相関)は高くならない。このため、例えば、入力画像中に手書きによる書き込みがある場合であっても、手書き文字によって不適切な特徴点が抽出されることを防止できる。したがって、上記の構成によれば、入力画像中に手書きによる書き込みがある場合であっても、当該入力画像の特徴点を適切に抽出することができる。
なお、本実施形態では、部分画像とこの部分画像の自己置換画像とが一致する場合に、この部分画像における注目画素を特徴点として抽出しているが、これに限るものではない。例えば、上記部分画像における、注目画素を含む複数の画素からなるブロックを特徴点として抽出してもよい。
また、本実施形態では、自己置換画像として縦軸鏡像置換画像、横軸鏡像置換画像、中心点対称置換画像、対角鏡像置換画像のうちのいずれかを用いるものとしたが、これに限るものではなく、自己置換画像は、部分画像の一部を当該部分画像における他の一部と所定の方法によって置換した画像であればよい。自己置換画像としては、例えば、部分画像を鏡像処理や対称置換処理、あるいはこれらの処理を組み合わせた処理などを施して得られるものを用いることができる。
また、部分画像と、この部分画像から生成される複数種類の自己置換画像との一致度をそれぞれ算出し、各自己置換画像に対する一致度の算出結果を用いて当該部分画像の中心画素を特徴点とするか否かを判定するようにしてもよい。
表1は、図12に示したパターンA〜Eについての、縦軸鏡像置換画像、横軸鏡像置換画像、中心点対称置換画像に対する一致度の判定結果を示している。
なお、表中に示した○は一致すると判定されるパターン、×は不一致と判定されるパターンを示している。
この表に示すように、一致度の判定結果は自己置換画像の種類によって異なるので、複数の自己置換画像に対する一致度を算出することで、自己置換画像毎に異なるパターンを一致するパターンとして抽出できる。
なお、例えば、複数の自己置換画像のそれぞれにおいて一致すると判定されたパターンの注目画素を特徴点とするようにしてもよく、複数の自己置換画像のうちのいずれか1つにおいて一致すると判定されたパターンの注目画素を特徴点とするようにしてもよく、複数の自己置換画像のうちの所定数以上において一致すると判定されたパターンの注目画素を特徴点とするようにしてもよい。
このように、複数種類の自己置換画像に対する一致度の判定結果を用いて特徴点を抽出することにより、特徴点数を容易に増加させることができる。これにより、より多くの特徴点に基づいて入力画像と登録画像との類似性を判定することができるので、類似性判定の精度をさらに高めることができる。
また、本実施形態では、制御部7は、パターン検知処理部46に部分画像を抽出させる際に、1つのL×Mという大きさの部分画像を切り出す場合を例示したが、部分画像の切り出し方法は1つに限るものではない。例えば、L×Mのサイズの部分画像に加えて、L’×M’(L’>N、M’>M)のサイズの部分画像にも着目し、同様の演算を行って特徴点としてもよい。
例えば、M=L==7、L’=M’=11とし、図28〜図30に示すパターンA〜Cの中心点を着目点として部分画像を抽出する場合を考える。なお、図28〜図30における破線で囲んだ枠領域が7×7のサイズの部分画像であり、実線で囲んだ枠領域が11×11のサイズの部分画像である。
上記各サイズの部分画像について、抽出した部分画像とこの部分画像の横軸鏡像置換画像(自己置換画像)との一致度を考えると、パターンAの場合、7画素×7画素では一致するが、11画素×11画素では一致しない。また、パターンBの場合、7画素×7画素でも11画素×11画素でも一致しない。また、パターンCの場合、7画素×7画素でも11画素×11画素でも一致する。このように、同じパターンから抽出した部分画像でも、部分画像を切り出すサイズ(部分画像の画素サイズ)に応じて自己置換画像との一致/不一致が変化する。
また、パターンBの場合、7画素×7画素でも11画素×11画素でも一致しないが、11画素×11画素の部分画像において7画素×7画素の部分画像領域を演算対象から除外(マスク)して自己置換画像との一致を判定すれば、一致するという結果になる。
なお、除外の演算方法としては、対象画素数に注意して、上記式(5)〜(7)におけるシグマ記号ごとにマスク部分を引けばよい。上記式(5)について記せば、
7×7画素:画素数Nm(=49)については、
11×11画素:画素数Nl(121)については、
マスクされた画像:画素数Nk(121−49=72)については、
となる。なお、Ak算出時に用いられているそれぞれシグマ演算値は、AmおよびAlを算出する際に求められているものであるため、新たに算出する必要はない。また、上記式(6)のBおよび上記式(7)のCも同様に算出可能である。
表2は、上記のようにして得られた部分画像とその横軸鏡像置換画像との一致/不一致を示している。なお、表中に示した○は一致すると判定されるパターン、×は不一致と判定されるパターンを示している。
表2に示したように、一致度の判定結果は部分画像の切り出しサイズやマスクの有無によって異なる。このため、複数の切り出し方法に対する一致度を算出することで、切り出し方法ごとに異なるパターンを部分画像とその自己置換画像とで一致するパターンとして抽出することができる。
なお、例えば、複数の切り出し方法のそれぞれにおいて一致すると判定されたパターンの注目画素を特徴点とするようにしてもよく、複数の切り出し方法のうちのいずれか1つにおいて一致すると判定されたパターンの注目画素を特徴点とするようにしてもよく、複数の切り出し方法のうちの所定数以上の方法において一致すると判定されたパターンの注目画素を特徴点とするようにしてもよい。
このように、複数の切り出し方法に対する一致度の判定結果を用いて特徴点を抽出することにより、抽出される特徴点の数を容易に増加させることができる。これにより、より多くの特徴点に基づいて入力画像と登録画像との類似性を判定することができるので、類似性判定の精度をさらに高めることができる。
また、本実施形態では、特徴点算出部31が、前処理部30から入力される多値画像の画像データに基づいて特徴点を抽出する場合の一例について説明したが、特徴点の抽出方法はこれに限るものではない。
例えば、前処理部30において2値化処理を行い、2値化した画像に基づいて特徴点を抽出するようにしてもよい。
この場合、前処理部30は、無彩化された画像データ(輝度値(輝度信号)あるいは明度値(明度信号))を、予め定められた閾値と比較することで画像データを2値化する。
そして、特徴点算出部31のパターン検知処理部46は、前処理部30で2値化された画像データから部分画像を抽出し、ON画素数(黒画素数)CountOnをカウントし、カウントした値が所定範囲内であるか否かによってパターンの有無を判定する。例えば、閾値TH2,TH3を予め設定しておき、TH2≦CountOn≦TH3の場合にはパターン有りと判定し、TH2>CountOnあるいはCountOn>TH3の場合にはパターン無しと判定する。なお、閾値TH2,TH3は、パターンが適切に抽出されるように適宜設定すればよい。
また、置換画像生成部47は、パターン検知処理部46においてパターン有りと判定された部分画像から自己置換画像を生成する。
その後、一致度算出部48は、部分画像(回転させる前の画像)の画素値と自己置換画像の画素値との一致数Snをカウントする。
図21(a)は部分画像の一例を示す説明図であり、図21(b)は図21(a)に示した部分画像の縦軸鏡像置換画像を示す説明図である。図21(a)および図21(b)の例では、部分画像と自己置換画像とで画素値が一致しているのは、図21(b)において黒で塗潰した画素である。したがって、この例の場合、部分画像と自己置換画像とで画素値が一致する画素数は「Sn=8」となる。
その後、一致度判定部49は、一致度算出部48がカウントした一致数Snの値と、予め設定された閾値TH_est2とを比較することで、部分画像と自己置換画像とが一致するか否かを判定する。例えば、Sn>TH_est2の場合に両画像が一致すると判定し、Sn≦TH_est2の場合に両画像は一致しないと判定する。なお、閾値TH_est2は、特徴点が適切に抽出されるように適宜設定しておけばよい。
また、部分画像と自己置換画像とにおける互いに対応する各画素についての画素値の差分の絶対値の総和である残差値Szを算出し、この残差値Szに基づいて特徴点を算出してもよい。
この場合、パターン検知処理部46および置換画像生成部47の処理は上記した処理と同様である。一致度算出部48は、下記式(11)に示すように、部分画像と自己置換画像とにおける互いに対応する各画素についての画素値の差分の絶対値の総和(残差値Sz)を算出する。なお、パターン検知処理部46に入力される画像データは、2値であっても多値であってもよい。
その後、一致度判定部49は、一致度算出部48で算出された残差値Szと、予め設定された閾値TH_est3とを比較することで、部分画像と自己置換画像とが一致するか否かを判定する。なお、残差値Szを用いる場合、残差値Szの値が小さいほど両画像の一致度は高くなる。このため、例えば、Sz<TH_est3の場合に両画像が一致すると判定し、Sz≧TH_est3の場合に両画像は一致しないと判定する。なお、閾値TH_est3は、特徴点が適切に抽出されるように適宜設定しておけばよい。
また、本実施形態では、入力画像データが1チャンネルの多値信号であり、この入力画像データを2値化した2値信号を用いて類似度判定を行う例について説明したが、入力画像データの構成はこれに限るものではない。例えば、入力画像データは、複数のチャンネル(例えばR,G,Bの3チャンネルあるいはC,M,Y,Kの4チャンネルなど)からなるカラー信号や、上記カラー信号に可視光外光源による信号を組み合わせたデータであってもよい。なお、この場合、前処理部30における信号変換処理部43の処理はスルー(処理を行わない)となる。信号変換処理部43における処理をスルーにするか否かは、例えば、画像形成装置3の操作パネル6を介して入力されるユーザによるカラー画像の選択指示(原稿種別の選択として、カラー画像と白黒画像があり、カラー画像が選択された場合)に応じて決定してもよく、あるいは、文書照合処理部13の前段に原稿画像(入力画像データ)がカラー画像であるか否かを判定する自動カラー選択部(図示せず)を設け、その判定結果に応じて決定するようにしてもよい。
自動カラー選択の方法としては、例えば、例えば、特許文献3に記載されている方法を用いることができる。この方法は、カラー画素であるかモノクロ画素であるかを各画素について判別し、所定数以上の連続するカラー画素の存在が検知された場合にこの連続カラー画素分をカラーブロックと認識し、1ライン中に所定数以上のカラーブロックが存在していればそのラインをカラーラインとして計数する。そして、原稿中にカラーラインが所定数存在していればカラー画像であると判断し、そうでない場合はモノクロ画像であると判断するものである。
例えば、カラー画像入力信号が一般的なR,G,Bの3チャンネル信号である場合、上記したように、各チャンネルを前処理部30において独立した多値信号として扱うか、あるいは2値化処理を行うことで、上述した実施形態と同様にチャンネルごとに特徴点を抽出することができる。
図31(a)はカラー画像からなる入力画像データの一例を示す説明図であり、図31(b)〜図31(d)は図31(a)の画像データに対応するRチャンネル、Gチャンネル、Bチャンネルの多値画像データを示す説明図である。図31(b)〜図31(d)に示したように、抽出される特徴点の位置はチャンネル毎に異なる。すなわち、図31(a)に示したような3つの色の各マーク(A:黒色、B:緑色、C:赤色)についての各チャンネルの画像(図31(b)〜図31(d))に基づく特徴点の抽出結果は表3のようになる。なお、表中に示した○は特徴点として判定されるパターン、×は特徴点として判定されないパターンを示している。
この表に示すように、特徴点の抽出対象となる部分画像はチャンネル毎に異なるので、これら各部分画像とその自己置換画像に基づいて抽出される特徴点もチャンネル毎に異なる。このため、複数のチャンネルを用いて特徴点の抽出を行うことで、より多くの特徴点を抽出できる。
なお、例えば、各チャンネルで抽出された特徴点をそれぞれ個別の特徴点とするようにしてもよく、複数のチャンネルのうちのいずれか1つにおいて部分画像と自己置換画像とが一致すると判定されたパターンの注目画素を特徴点とするようにしてもよく、複数のチャンネルのうちの所定数のチャンネルにおいて部分画像と自己置換画像とが一致すると判定されたパターンの注目画素をそれぞれ個別の特徴点とするようにしてもよい。
このように、複数チャンネルにおける部分画像と自己置換画像との一致度の判定結果を用いて特徴点を抽出することにより、特徴点の数あるいはそれに付随する情報を容易に増加させることができる。これにより、より多くの特徴点に基づいて入力画像と登録画像との類似性を判定することができるので、類似性判定の精度をさらに高めることができる。
また、本実施形態では、本発明をデジタルカラー複合機1に適用する場合について説明したが、本発明の適用対象はこれに限るものではない。例えば、モノクロの複合機に適用してもよい。また、複合機に限らず、例えば単体のファクシミリ通信装置、複写機、画像読取装置などの画像処理装置に適用してもよい。
図22は、本発明をフラットベッドスキャナ(画像読取装置、画像処理装置)1’に適用した場合の構成例を示すブロック図である。
この図に示すように、フラットベッドスキャナ1’は、カラー画像入力装置2とカラー画像処理装置3’とを備えている。カラー画像処理装置3’は、A/D変換部11、シェーディング補正部12、文書照合処理部13、制御部7(図22では図示せず)、メモリ8(図22では図示せず)から構成されており、これに、カラー画像入力装置2が接続され、全体として画像読取装置1’を構成している。なお、カラー画像入力装置(画像読取手段)2におけるA/D変換部11、シェーディング補正部12、文書照合処理部13、制御部7、メモリ8の機能は、上述したデジタルカラー複合機1と略同様であるのでここでは説明を省略する。
また、文書照合処理部13の機能を、画像処理装置と、この画像処理装置に通信可能に接続されたサーバー装置とからなる画像処理システムによって実現してもよい。図23は、画像処理装置(複合機(MFP)A,B,・・・、プリンタA,B,・・・、ファクシミリA,B,・・・、コンピュータA,B,・・・、デジタルカメラA,B,・・・、スキャナA,B,・・・)と、サーバー装置50とが通信可能に接続されてなる画像処理システム100の構成を示す説明図である。なお、画像処理システム100の構成はこれに限るものではなく、例えば、サーバー装置50と、複合機、プリンタ(画像形成装置)、ファクシミリ、コンピュータ、デジタルカメラ(画像読取装置)、スキャナ(画像読取装置)のうちのいずれか1つ以上とからなるものであってもよい。
上記スキャナは、原稿台、光走査部、CCD(charge coupled device)等を備えており、原稿台に載置された原稿画像を光走査部によって走査することで原稿画像を読み込んで画像データを生成する。また、上記デジタルカメラは、撮像レンズ、CCD等(画像入力装置)を備えており、原稿画像、人物や風景等を撮影して画像データを生成する。なお、上記スキャナおよびデジタルカメラは、画像を適切に再現するために所定の画像処理(例えば各種補正処理等)を施す機能を有していてもよい。上記プリンタは、コンピュータ、スキャナ、デジタルカメラによって生成された画像データに基づく画像をシート(記録用紙)に印刷する。また、上記ファクシミリは、画像入力装置より読み込まれた画像データに対して、2値化処理、解像度変換処理、回転等の処理を行って所定の形式に圧縮した画像データを相手先に送信したり、相手先から送信されてきた画像データを伸張して画像出力装置の性能に応じて回転処理や解像度変換処理、中間調処理を施し、ページ単位の画像として出力したりする。また、上記複合機は、スキャナ機能、ファクシミリ送信機能、印刷機能(複写機能、プリンタ機能)のうちの少なくとも2つ以上を有するものである。また、上記コンピュータは、スキャナやデジタルカメラにより読み込まれた画像データに対して編集を行ったり、アプリケーションソフトウェアを用いて文書の作成を行ったりする。
画像処理システム100では、上述した文書照合処理部13の各部が、サーバー装置50と、サーバー装置50にネットワークを介して接続される画像処理装置とに分散して備えられている。そして、画像処理装置とサーバー装置50とが協働して文書照合処理部13の機能を実現するようになっている。
図24は、文書照合処理部13が有する機能が、サーバー装置50とデジタルカラー複合機1とに分散して備えられている場合の一構成例を示すブロック図である。
図24に示すように、デジタルカラー複合機1のカラー画像処理装置3は、前処理部30、特徴点算出部31および特徴量算出部32を備えた文書照合処理部13aと、文書照合処理部13aの動作を制御する制御部7aと、文書照合処理部13aの処理に必要な情報を記憶するメモリ8aと、外部の装置との通信を行う通信装置5とを備えている。また、サーバー装置50は、外部の装置との通信を行う通信装置51、投票処理部33、類似度判定処理部34、および登録処理部37を備えた文書照合処理部13bと、文書照合処理部13bを制御する制御部7bと、文書照合処理部13bの処理に必要な情報を記憶するメモリ8bとを備えている。なお、デジタルカラー複合機1に備えられる各機能ブロックとサーバー装置50に備えられる各機能ブロックとの間でデータの送受信が必要な場合には、制御部7aおよび制御部7bが通信装置5および51を制御して適宜データの送受信を行う。その他の機能については上述した構成と同様である。
また、図24の例では、特徴量算出部32の全部(特徴点抽出部32a、不変量算出部32b、ハッシュ値算出部32c)がデジタルカラー複合機1に備えられているが、これに限らず、例えば図25に示すように、特徴点抽出部32aおよび不変量算出部32bをデジタルカラー複合機1に備える一方、ハッシュ値算出部32cをサーバー装置50に備えた構成としてもよい。
また、特徴量算出部32の各部をサーバー装置50に備えておき、特徴点算出部31の算出した特徴点に関するデータをデジタルカラー複合機1からサーバー装置50に送信し、サーバー装置50に備えられる特徴量算出部32がメモリ8bに格納されているハッシュテーブル103と受信した特徴点のデータとに基づいてハッシュ値を算出するようにしてもよい。また、特徴点算出部31および特徴量算出部32の各部をサーバー装置50に備えておき、デジタルカラー複合機1からサーバー装置50に入力画像データを送信し、サーバー装置50に備えられる特徴点算出部31および特徴量算出部32がサーバー装置50から受信した入力画像データとメモリ8bに格納されているハッシュテーブル103とに基づいてハッシュ値を算出するようにしてもよい。
また、上記の説明では、類似性の判定処理を行う場合の例について説明したが、登録処理を行う場合には、サーバー装置50に備えられる登録処理部37が、デジタルカラー複合機1から受信した原稿IDとハッシュ値(あるいはサーバー装置50に備えられるハッシュ値算出部32cが算出したハッシュ値)とをメモリ8bに設けられたハッシュテーブル103に登録すればよい。なお、類似性判定処理を行うか登録処理を行うかは、デジタルカラー複合機1のユーザが操作パネル6を介して指定し、何れの処理を行うのかを示す信号をサーバー装置50に送信するようにしてもよく、サーバー装置50が類似性判定処理の結果、類似なしと判定した入力画像について登録処理を行うようにしてもよい。
なお、ハッシュ値算出部32cをサーバー装置50に備える場合、ハッシュテーブル103に格納されているハッシュ値の算出方法とは異なる方法で(別のハッシュ関数を用いて)ハッシュ値を算出し、算出したハッシュ値を採用してハッシュテーブル103を更新してもよい。これにより、例えば原稿画像の種類等に応じて特徴量(不変量)を参照した適切なハッシュ値をハッシュテーブル103に登録(更新)することができ、それを用いて投票処理を行えるので、照合精度(類似性の判定精度)を向上させることができる。
また、上記各実施形態において、デジタルカラー複合機1および/またはサーバー装置50に備えられる文書照合処理部および制御部を構成する各部(各ブロック)は、CPU等のプロセッサを用いてソフトウェアによって実現される。すなわち、デジタルカラー複合機1および/またはサーバー装置50は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機1および/またはサーバー装置50の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機1および/またはサーバー装置50に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、デジタルカラー複合機1および/またはサーバー装置50を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、デジタルカラー複合機1および/またはサーバー装置50の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
本発明のコンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記類似度算出処理や類似性判定処理など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置、およびコンピュータの処理結果を紙などに出力するプリンタ等の画像形成訴追により構成されてもよい。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられていてもよい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。