JP2003091730A - 画像照合装置、画像照合方法および画像照合プログラム - Google Patents

画像照合装置、画像照合方法および画像照合プログラム

Info

Publication number
JP2003091730A
JP2003091730A JP2001284095A JP2001284095A JP2003091730A JP 2003091730 A JP2003091730 A JP 2003091730A JP 2001284095 A JP2001284095 A JP 2001284095A JP 2001284095 A JP2001284095 A JP 2001284095A JP 2003091730 A JP2003091730 A JP 2003091730A
Authority
JP
Japan
Prior art keywords
image data
image
similarity
peak
collation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001284095A
Other languages
English (en)
Other versions
JP4140221B2 (ja
Inventor
Kagenori Nagao
景則 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2001284095A priority Critical patent/JP4140221B2/ja
Publication of JP2003091730A publication Critical patent/JP2003091730A/ja
Application granted granted Critical
Publication of JP4140221B2 publication Critical patent/JP4140221B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 書き込みや押印等のノイズがあっても安定し
た結果を得ることができ、OCR等テキストデータを抽
出する必要がなく、テキストのみからなる文書データ同
士をも照合することができる画像照合装置を提供する。 【解決手段】 制御部11が、スキャナ部15から入力
される画像データを処理対象として所定の複数の経路に
沿って順次画素値を累算し、当該演算順に累算値を配列
した累算値系列を用いてストレージ13に蓄積された画
像データとの照合を行い、その結果を表示部16に出力
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データ同士を
照合する画像照合装置に関する。
【0002】
【従来の技術】近年、記憶装置が大容量化し、ネットワ
ークが高速化してきており、これに伴って、文書データ
や画像データをデータベースに登録して複数の利用者で
共有する、文書管理システムが普及しつつある。このよ
うな文書管理システムを用いると、他の利用者が作成し
た文書データや画像データを別の利用者が閲覧、流用す
ることができる。
【0003】文書管理システムの効率的な運用のために
は、蓄積されている大量のデータの中から閲覧や流用の
対象となる文書データ等が迅速に見つけ出せるよう、検
索機能の充実が望まれている。そこで従来の文書管理シ
ステムでは、文書データや画像データをデータベースに
登録する際に、登録者やデータベースの管理者が検索の
ためにキーワードや所定の分類コードを関連づけて登録
するなど、検索に配慮した登録を行う必要があって管理
者等の負担が大きくなる。
【0004】また、すでに膨大な文書データ等が蓄積さ
れているような場合、またはデータベースシステムの交
換などデータの再登録作業を要する場合、改めて全文書
データや画像データに対してキーワード等を入力するの
は現実的でない。
【0005】文書データならば、データベースへの登録
処理を自動化するために、システムが文書データからキ
ーワードを抽出する技術や、いわゆる全文検索技術など
がある。しかし、紙文書をスキャナ等で読み込んだ文書
画像データにはこれらの技術をそのまま適用することは
できない。このような画像データに対しては、いわゆる
OCR(Optical Character Recognition)技術を利用
して画像データ内に含まれているテキスト部分をテキス
トデータ化し、このテキストデータに対して上記の全文
検索等の処理を行なうことになる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の文書管理システムのように、画像データをOCRに
て読み込む場合、紙文書に書き込みや押印などのノイズ
があったり、文書のレイアウトが複雑である場合は文字
認識精度が大幅に低下し、全文検索等の用途に供するに
は実用的でない。
【0007】具体的に通常の企業活動では、社内で回覧
されてきた紙文書内の記述(例えばグラフなど)を流用
して新たな書類を作成したいというような場合がある。
この場合、回覧中になされた手書きの書き込みや押印が
なければスキャナにより流用したい部分をデータ化して
取り込むことも容易であるが、通常これらが存在するた
めに、取り込みが困難になっていることも多い。そこで
文書管理システムのデータベースから原本の画像データ
を取り出したい、という要望が生まれるのであるが、上
記従来の文書管理システムでは、全文検索技術等を利用
しているので、テキストデータの存在が前提であるう
え、テキストデータがあっても原本が画像データである
ときには、レイアウトが複雑であったりすると(グラフ
などではレイアウトは極めて複雑になる)、上述のよう
にOCRの精度が落ち、テキストデータが正しく取り出
されず、その結果、検索用のテキストデータが誤ったも
のとなり、全文検索の際に見落とされてしまうのであ
る。
【0008】そこで、画像データ同士の比較により、所
望の画像データの検索を行う技術(類似画像検索技術)
が、例えば「コンピュータ画像処理:応用実践編3,総
研出版,pp.187-227,1992」で紹介されている。しか
し、この技術は自然画のように自由度の大きい画像デー
タには適しているが、構造的に非常に類似した文書を識
別するのは難しく、逆に識別能を高めると文書上の書き
込みや押印等のノイズに対する耐性が大きく損なわれる
ことが知られている。
【0009】また、特開2000-112995号公報には、罫線
や線画などの情報のみを用いて画像データの照合を行う
技術が開示されている。しかしこの技術ではテキストの
みから構成されている文書の照合を行なうことができな
い。さらに特開平7-282088号公報には、単語長のパター
ンを照合してテキストを含んだ画像データ同士を照合す
る技術が開示されている。この技術は単語間が分離して
いるような言語、例えば英語には適しているが、単語間
が必ずしも分離していない日本語にはOCRを用いる必
要があり、結局テキストデータを正しく抽出できないよ
うな場合には適用できない。
【0010】本発明は上記実情に鑑みて為されたもの
で、書き込みや押印等のノイズがあっても安定した結果
を得ることができ、OCR等テキストデータを抽出する
必要がなく、テキストのみからなる文書データ同士をも
照合することのできる画像照合装置を提供することを目
的とする。
【0011】
【課題を解決するための手段】上記従来例の問題点を解
決するための本発明は、画像照合装置であって、処理対
象となった画像データに対し、複数の所定経路の各々に
ついて、経路上の画素値を累算する演算手段と、前記各
経路上の画素値を累算した結果を経路の演算順に含んで
なる累算値系列を用い、複数の画像データ間の照合処理
を行う手段と、を含むことを特徴としている。
【0012】ここで前記経路は、互いに直交する2つの
軸方向のそれぞれに沿って複数配列され、各軸方向ごと
に累算値系列が演算され、前記照合処理を行う手段が、
各軸方向ごとの累算値系列の比較により照合の処理を行
うことも好ましい。さらに、前記照合処理を行う手段
が、照合の対象となった各画像データについての累算値
系列間の相似性に基づき、照合を行うこととするのも好
ましい。
【0013】また、上記従来例の問題点を解決するため
の本発明は、前記相似性を検出するために、照合の対象
となった各画像データについて、それぞれの累算値系列
内での累算値の変化が特徴的となる系列上の位置を表
す、系列位置情報を生成し、当該各累算値系列に対する
系列位置情報を比較して、少なくとも平行移動量を含ん
でなる相似変換パラメータを演算し、当該相似変換パラ
メータを用いて、各累算値系列の相似性を検出すること
を特徴としている。ここで、相似変換パラメータには、
さらに一次変換パラメータを含む。すなわち、相似変換
パラメータは、アフィン変換の際に用いられる一次変換
係数及び平行移動の量である。また、前記累算値の変化
が特徴的となる系列位置情報は、累算値のピーク位置の
リストであることが好ましい。
【0014】さらに、前記相似変換パラメータを決定す
るために、照合の対象となった各画像データのうち、相
異なる画像データについてのピーク位置のリストを参照
し、各ピーク位置同士の組み合わせについて相似変換パ
ラメータを推定し、前記組み合わせごとに推定された相
似変換パラメータを含んでなる推定相似変換パラメータ
群を生成し、当該推定相似変換パラメータ群に含まれる
各推定相似変換パラメータに基づき、尤度の高いパラメ
ータとして前記相似変換パラメータを決定することが好
ましい。
【0015】すなわち本発明による画像照合装置では、
原本である画像データを検索するために、検索対象とな
る画像を入力し、該入力した画像の水平・垂直方向の少
なくとも一方への投影波形を形成し、該水平または垂直
方向の投影波形から特徴量を抽出し、前記入力した画像
の投影波形、もしくは照合対象となる基準画像(原本の
候補となる画像データ群)の投影波形の少なくとも一方
に対して、相似変換処理を行なった変換投影波形を生成
し、入力した画像の投影波形から抽出された前記特徴量
と、前記基準画像の投影波形から抽出された特徴量との
対応関係から、前記投影変換手段で適用する変換パラメ
ータを求め、前記入力した画像の投影波形またはその変
換投影波形と、前記基準画像の投影波形またはその変換
投影波形との類似度を測定する。
【0016】具体的に上記抽出される特徴量は、投影波
形の局所的ピークであり、該投影波形において検出され
た全ての局所的ピークの中から、所定の条件を満たすピ
ークの位置のみを選別してピークリスト(系列位置情
報)として取り出したものである。
【0017】さらに変換パラメータを得るための処理は
次のようになる。すなわち、前記入力画像のピークリス
トにおける局所的ピーク位置と、照合対象となる基準画
像のピークリストにおける局所的ピーク位置との対応付
けを全てのピーク位置の組み合わせについて行ない、最
も尤度の高いパラメータを決定するために、(スケーリ
ング補正量)−(平行移動量)平面において該直線上へ
の投票処理を行ない、該投票処理によって前記(スケー
リング補正量)−(平行移動量)平面上に形成された投
票値のピーク座標を検出し、該ピーク座標に対応するス
ケーリング補正量及び平行移動量を見いだす。これは、
上記の対応付けにおいて対応付けられた2つのピーク位
置を一致させるために必要なスケーリング補正量と平行
移動量が直線関係を為すことに基づく。
【0018】これにより、画像上の所定経路に対する投
影波形を形成し、比較に係る各画像データの投影波形を
利用して照合するので、文書への押印、書き込み等があ
っても、大域的な投影波形の変化状態(波形そのものや
微分波形間の相関係数)は一致したままとなり、かかる
ノイズ成分が類似度測定に与える影響は限定的となる。
また、所定経路を水平・垂直方向への各経路とすること
で、特に水平・垂直成分を多く含む文書画像に対して高
い照合能力を発揮する。
【0019】また入力画像の投影波形とデータベース内
画像の投影波形との照合に先立って、両波形が最も良く
一致するようにアフィン変換による投影波形の相似変換
処理を行なうため、入力画像の拡大率の違いや位置ずれ
を許容することができる。ここで相似変換のためのパラ
メータ(相似変換パラメータ)は、投票処理、換言すれ
ば多数決原理に基づいて尤度の高いものが求められるた
め、局所的ピークの検出時に少数の誤検出や検出漏れが
あっても補正量は正当なものを求めることができる。
【0020】また、上記従来例の問題点を解決するため
の本発明は、画像照合方法であって、処理対象となった
画像データに対し、複数の所定経路の各々について、経
路上の画素値を累算する工程と、前記各経路上の画素値
を累算した結果を経路の演算順に含んでなる累算値系列
を用い、複数の画像データ間の照合処理を行う工程と、
を含むことを特徴としている。
【0021】さらに、上記従来例の問題点を解決するた
めの本発明は、画像照合プログラムであって、処理対象
となった画像データに対し、複数の所定経路の各々につ
いて、経路上の画素値を累算する工程と、前記各経路上
の画素値を累算した結果を経路の演算順に含んでなる累
算値系列を用い、複数の画像データ間の照合処理を行う
工程と、をコンピュータに実行させることを特徴として
いる。
【0022】
【発明の実施の形態】本発明の実施の形態について図面
を参照しながら説明する。まず、本発明の実施の形態に
係る画像照合装置がいかなる原理に基づき画像データ間
の照合を行うかについて概括的に説明する。
【0023】本実施の形態の画像照合装置は、いわば画
像データ自体をキーとして、類似する画像データをデー
タベースから検索するもので、キーとなる画像データ
は、スキャナ等の画像入力手段によって読み取られ、ラ
スタ画像データに変換される。そして、このラスタ画像
データに対し、水平方向又は垂直方向の少なくとも一方
に対する投影波形を形成する。例えば読み込まれる文書
が縦書きであるか横書きであるかが予めわかっており、
当該方向の投影波形のみで十分個々の文書の特徴を表す
ことができることがわかっている場合は、一方向のみへ
の投影を形成するだけでも良いが、画像データの特徴が
不明瞭な場合は両方向への投影波形を形成するのが好ま
しい。
【0024】ここで投影とは、ラスタ形式の画像データ
に対し、ある経路に沿って、当該経路上の画素の画素値
を累算する処理をいい、当該経路が複数ある場合に、そ
の累算した結果の数列が投影波形をなす。コンピュータ
処理による場合には画素値の累算結果が経路ごとに得ら
れ、この累算結果の組(累算値系列)により投影波形を
ディジタル表現することになる。この場合、現実的には
投影波形の形成処理前に公知の傾き補正技術を利用して
読み取り時の軽微な傾きを補正しておくことが好まし
い。
【0025】また、データベース内の画像データに対し
ては、事前に投影波形を作成しておき、画像データと関
連づけておくことが好ましい。ここで登録されたデータ
がスキャナ等によって読み込まれた画像データの場合は
そのまま投影波形を生成することができるが、ワープロ
等で作成したテキストデータである場合は、これをラス
タライズして、画像データに変換し、その後に投影波形
の生成を行なう。
【0026】なお、投影波形は垂直、水平方向のみなら
ず、任意の複数経路上で画素値を累算するものであって
構わないが、比較を行うために、各経路は事前に決定し
ておく必要があり、また累算を行う順序(各経路の順
序、すなわち累算値の演算の順序)を同じにしておく必
要がある。累算値系列は順列で比較されるものだからで
ある。
【0027】このようにして、キーとなる画像データの
投影波形とデータベース内の画像データとの投影波形が
求められ、これらの投影波形の類似度を演算して、類似
度の高いものを検索結果としてユーザに提示する。
【0028】本実施の形態において特徴的なことは、キ
ーとなる画像データに一致する画像データがある場合で
も、両画像データの縮尺が変化していたり、読み取りを
行う際に異なる解像度で読み取られる可能性があり、投
影波形をそのまま比較しても類似度が適切な値とならな
い場合に配慮して各投影波形に基づき、スケーリングの
パラメータを求め、スケーリングの処理を行うことであ
る。また、画像データの読み取りの際の都合によっては
画像全体が平行移動した状態で読み取られたり、上下反
転したり、縦横が置き換えられたり、傾きをもって読み
取られたりする場合もある。このような場合を想定し
て、投影波形に対し、アフィン変換を施して比較する。
これにより相似度によって比較することとなり、検索の
正確性を向上できる。
【0029】ここでアフィン変換の対象となる投影波形
は、データベース内の画像データに関するものであって
もよいし、キーとなる画像データであってもよい。デー
タベース内の画像データに対してアフィン変換を行う場
合、データベース内の画像データに対し、投影波形を事
前に演算してあれば、キーとなる画像データを読み取る
スキャナの解像度などに合わせて、この事前に演算して
得た投影波形を所定のスケール(既定スケール)にスケ
ーリングした、いわば規格化した投影波形を用意してお
くことも好ましい。
【0030】次に、このアフィン変換のためのパラメー
タ(相似変換パラメータ)を求める方法について概説す
る。本実施の形態では、相似変換パラメータを求めるた
めに、各投影波形の特徴的部分を抽出し、その位置関係
を比較して相似変換パラメータを得る。ここで特徴的部
分としては、極値(局所的ピーク)、変曲点などの微分
波形特徴量であってもよいし、最大値や、所定値となる
位置、重心位置、ピークの幅など投影波形自体から得ら
れる特徴量であってもよい。データベース内の画像デー
タに対しては、これらの特徴量を事前に抽出し、対応す
る画像データに関連づけておくことも好ましい。
【0031】例えば各投影波形の局所的ピークが求めら
れた場合、この局所的ピークの位置を求める。通常投影
波形内に複数の局所的ピークがあるので、この位置は、
位置のリストとなる。この位置のリスト(ピークリス
ト)が本発明の「系列位置情報」に相当するものとな
る。
【0032】そしてキーとなる画像データの投影波形に
関するピークリストと、データベース内の画像データの
投影波形に関するピークリストとを比較して相似変換パ
ラメータを求める。この比較処理においては、各ピーク
位置を対応付けして相似変換パラメータを求めるのであ
るが、例えば図1に概略を示すように、比較される2つ
の投影波形にそれぞれ3つのピーク(A,B,C及び
α,β,γ)があり、2つの画像データが同じ画像デー
タである場合に、Aとα、Bとβとを一致させる(正し
い)対応付けを行った場合と、Aとβ、Bとγを一致さ
せる(誤った)対応付けをした場合とでは次のように事
情が異なる。なお、以下の説明では簡単のため、比較さ
れる両画像データの縮尺は一致しているものとする(す
なわちスケーリングについては考えない)。なお、図1
では説明のため、ピーク以外を平坦で示した。
【0033】すなわち、Aとαとの関係により求められ
る平行移動量と、Bとβとの関係により求められる平行
移動量とはほぼ一致するのに対し、Aとβとの関係によ
り求められる平行移動量と、Bとγとの関係により求め
られる平行移動量は一般に異なるのである。
【0034】そこで、すべての対応付けを総当たり的に
試行し、各結果同士を比較して多数決原理により最も尤
もらしい値(最尤値)を求めることにより、適切な値が
求められることになる。
【0035】スケーリング補正を要する場合、それぞれ
のピークリスト内のピーク位置の対応関係からは、スケ
ーリング量kと平行移動量sとの関係が求められる。す
なわち、一方の画像データに関連するピーク位置xi
と、他方の画像データに関連するピーク位置ξiとを対
応づける場合、次の(1)式の関係が得られる。
【0036】
【数1】
【0037】そして各ピーク位置の総当たり的に対応付
けて、(1)式による直線をk−s平面((スケーリン
グ補正量)−(平行移動量)平面)に複数描画すると、
理想的には多くの直線が交差する座標が求められ、この
座標値(k,s)として正しいスケーリング補正量が求
められることとなる。ここで「理想的には」というの
は、演算の誤差等の要因により、各直線から求められる
kやsは必ずしも一致しないからである。そこで多数決
原理により最尤値を選んでk,sを決定することにな
る。このように正しく対応付けがされた場合に、多数の
パラメータの候補がある値近傍に集まることに着目し、
多数決原理を利用して最尤値を求めているのである。同
様にして、例えば一方の画像データの水平方向に対する
投影波形のピークリストと、他方の画像データの垂直方
向に対する投影波形のピークリストとが正しく対応づけ
られる(つまりより多数のパラメータ候補があるパラメ
ータ値近傍に集まる)ならば90度回転したものと判別
することができ、この場合に一方のピークリストの順序
を入れ替える(要するに一方の投影波形の向きを逆転す
る)とよりよく対応付けられるとするならば、反転して
いるものと判別することができるなど、回転、反転、ス
ケーリングなどを含んだ一次変換パラメータを同様の処
理によって求めることができる。なお、以下では、説明
を簡約にするため、スケーリング補正と平行移動とに限
って説明をする。
【0038】また、ここまでの説明ではキーとなる画像
データの投影波形と、データベース内の画像データに対
する投影波形とを比較するとしたが、それぞれの波形を
微分して得た、微分波形同士を比較しても良い。キーと
なる画像データとして複写文書を用いる場合、画像デー
タに写真やドローイングのような中間調領域を含んでい
ると、その濃度値は大きく変化している場合が多く、そ
の投影波高値も安定しない場合が多い。このような場合
でも投影波形の凹凸の様子は多くの場合維持されている
ので、比較の対象として微分投影波形を用いる方が好ま
しい場合も多いからである。
【0039】さらに、ここでは投影波形からピークリス
トを作成するにあたり、投影波形そのものを用いている
が、文字列から生成される投影波形には高周波成分が多
く、また書き込みや押印などによるノイズ成分も多く含
んでいる一方、相似変換パラメータの推定の際には、行
のピッチや各行の長さなどの情報を用いれば十分であ
り、これら行のピッチなどの形状は投影波形の低域成分
に反映される。そこで、ノイズ除去や局所的ピーク検出
処理の安定化の観点から、投影波形の低域濾波処理を行
う。さらに、低域濾波された投影波形にも微小な凹凸が
残っているために、数多くの局所的ピークが検出され、
演算量が大きくなるので、相似変換パラメータの推定に
必要となる大局的な凹凸を表す局所的ピークの位置のみ
をピークリストに含めることが好ましい。
【0040】そこで以下、大局的な凹凸を表す局所的ピ
ークのみを検出する方法について概説する。図2は投影
波形の大局的な凹凸の様子を検出するための局所的ピー
ク検出法を説明する図である。図2において、p(x)
は低域濾波後の投影波形の位置xにおける波高値、αは
所定のウインドウ幅である。局所的ピーク位置では投影
波形の傾きがゼロになるが、これを微分投影波形のゼロ
交叉点として求めるかわりに、ウインドウの両端位置で
の投影波高値を結ぶ直線の傾きにより求める。位置Xa
におけるこの直線の傾きは次の(2)式のS(Xa)に
比例する。
【0041】
【数2】
【0042】このS(Xa)の正負が変化する点が局所
的ピーク位置である。ここで当該点が正から負へ変化す
る凸ピークであるか、負から正へ変化する凹ピークであ
るかを表す情報をピーク属性情報としてピークリストと
ともに取得しておくことが好ましい。このように注目位
置から一定の距離αだけ離れた点での投影波高値を参照
することにより、投影波形の微小な凹凸に影響されるこ
となく、投影波形の大局的な凹凸の様子を表すピーク候
補を検出することができる。
【0043】そしてこれらピーク候補から、相似変換パ
ラメータの検出に有効なピークのみを選別する。相似変
換パラメータは投影波形の大局的な凹凸を対応付けるこ
とによって求められるため、微小なピークは取り除いた
方がよい。
【0044】図3は局所的ピークを選別する手段の動作
原理を示す図である。図3では図2に示した方法により
得られた局所的ピークの候補の位置(x1〜x5までの、
計5点)が検出されている。この図3の例では、例えば
x2やx3における局所的ピークが微小な凹凸として除外
したいピーク候補である。
【0045】微小な局所的ピークを除外するために、本
実施の形態では、以下のような処理を行なう。すなわ
ち、ある局所的ピーク位置Xnについて、その位置での
投影波高値と、隣接する局所的ピーク位置での波高値と
の差に関する量Dnを次の(3)式のように求める。
【0046】
【数3】
【0047】また、位置x1やx5のような片側にのみ隣
接する局所的ピークを持つものに関しては、その局所的
ピークの波高値との差に対する絶対値をDnとする。
【0048】このようにして求めたDnと所定のしきい
値Tdとが次の(4)式の条件を満たす場合に、位置Xn
における局所的ピークを実際に比較対照となるピークと
してピークリストに加える。
【0049】
【数4】
【0050】また、隣接する局所的ピーク位置における
投影波高値の差ではなく、(5)式に示すような波高値
の比Rnを用いてピークの選別を行なってもよい。
【0051】
【数5】
【0052】そして、この(5)式により求めたRnと
所定のしきい値Trとが(6)式の条件を満たす場合
に、位置Xnにおける局所的ピークをピークリストに加
える。
【0053】
【数6】
【0054】さらにピークリスト間の比較に補助的に資
する目的で、ピーク属性情報として、投影波形の幅と重
心を求めておくことも好ましい。これらの情報は変換パ
ラメータ検出に必須のものではないが、後述するように
変換パラメータの検出の高速化や信頼性の向上に役立て
ることができる。
【0055】ここでピークの幅を求める場合、投影波形
にノイズか含まれておらず、また紙の地色等によるオフ
セット分も含まれていない場合は、投影波形の非ゼロ区
間の幅を以って投影波形の幅とすれば良い。しかし、こ
のような理想的な例は極めて希であるため、実際には投
影幅を求めるためには次のような処理を行なう必要があ
る。
【0056】図4は投影波形の幅を検出するための処理
を説明する図である。実際の投影波形には図4のA,B
の領域のようにノイズや紙の地色等によるオフセット分
(地色により画素が部分的に「白」でなくなっているた
めに発生する非ゼロ領域)が含まれている。そこでこれ
らの成分を除去するためにしきい値処理を行なう。ただ
し、しきい値付近の波高値が多く存在する場合は、しき
い値を越えるか否かの微妙な違いが検出される投影波形
の幅に大きく影響するため、図4の例では投影波形に対
して2つの相異なるしきい値、ThとTlを設定する。こ
れらのうち低い方のしきい値Tlは、ノイズやオフセッ
ト分のほとんどがこの値を下回るように設定され、高い
方のしきい値Thは本来の投影波形のほとんどがこの値
を上回るように設定される。
【0057】このようなしきい値を設定した上で、投影
波形の幅Wを次の(7)式により求める。
【0058】
【数7】
【0059】ここで、w(・)は、図5に示すように、
0<x<Tlであるようなxで「0」、Th<xとなるよ
うなxで「1」となり、Tl<x<Thでは、「0」から
「1」まで線形に変化する関数である。また、Pは投影
波形全体を表し、従って(7)式では、投影波形全体に
亘って総和することを意味する。このようにしきい値T
h、Tl間になだらかな勾配を持つしきい値処理関数を設
けることにより、単一しきい値を用いた時に問題となる
しきい値付近の投影波形が多く存在する場合でも、検出
される投影波形の幅に大きく差が生じないようにするこ
とができる。
【0060】一方、投影波形の重心位置Gは次の(8)
式から求められる。
【0061】
【数8】
【0062】こうして求められたピークリスト及びピー
ク属性情報を利用して相似変換パラメータを求める。次
に具体的に相似変換パラメータを求める手続きについて
概説する。まずキーとなる画像データと、データベース
内の比較対象となる画像データとのそれぞれのピークリ
ストを参照し、ピーク位置の対応付けを行なう。ピーク
位置の対応付けはピーク属性情報を参照して凸ピークと
凹ピークについて別々に行なう。次に対応付けられた2
つの局所的ピーク位置を一致させるために必要なスケー
リング補正量と平行移動量が直線関係を為すことに基い
て、(スケーリング補正量)−(平行移動量)平面にお
いて該直線上への投票処理を行なう。このような投票処
理を全ての局所的ピーク位置の組合わせについて行なう
と、(スケーリング補正量)−(平行移動量)平面上に
は投票値の累積値の分布が形成される。(スケーリング
補正量)−(平行移動量)平面上において、この累積投
票値が大きくなる点は、2つの局所的ピークリストが良
く一致することを示しているため、その点の座標(スケ
ーリング補正量,平行移動量)が求める相似変換パラメ
ータとなる。
【0063】すなわち、図6に示すように、投影波形に
対する局所的凸ピークリスト(A1〜A3)と、キーとな
る画像データの投影波形から求められた局所的凸ピーク
リスト(B1〜B4)がある場合、上記2つの局所的ピー
クリストについてピーク位置の対応付けを行なう。例え
ば局所的ピークA1とB1の対応付けを行なう場合、両者
のピーク位置が一致するために必要なスケーリング補正
量をk、平行移動量をsとすると、A1の座標「10」
と、B1の座標「19」とを用いて、次の(9)式が成
り立つ。
【0064】
【数9】
【0065】この(9)式はkとsに関する一次式であ
るので、これに基づきk−s平面、即ち(スケーリング
補正量)−(平行移動量)平面において一本の直線を描
画できる。(9)式の条件に拘束されるk,sを用いれ
ば、比較に係る両画像データは、少なくとも局所的ピー
ク位置A1とB1では重ね合わせることができる。そこ
で、補正量の候補としてこの直線上に「一票を投じ
る」。すなわち、この直線上の各点に投票を行う。後に
この投票数の多い点を最尤点として求めたいのである。
【0066】また同様にして図6に示した局所的ピーク
A1を他のB2〜B4にも対応付けることにより、(スケ
ーリング補正量)−(平行移動量)平面において、A1
に関しては都合4本の直線上への投票を行なうことにな
る。一般にあるデータベース内の画像データの投影波形
から求められた局所的ピークリストにおけるi番目のピ
ークの位置をAix、キーとなる画像データの投影波形に
対する局所的ピークリストにおけるj番目のピークの位
置をBjxとすると、両者のピーク位置が一致するために
必要なスケーリング補正量k、および平行移動量sの関
係は(1)式と同様に、(10)式の関係になる。
【0067】
【数10】
【0068】そして同様の投票処理を残りの局所的ピー
クA2およびA3についても行なうことにより、(スケー
リング補正量)−(平行移動量)平面上には投票値の累
積値の分布が形成される。
【0069】尚、投票値は上の例のように常に1票を投
じる他にも、局所的ピークの波高値情報を反映した投票
値を用いることもできる。局所的ピークについては、そ
の波高値の大きなもの同士、あるいは小さなもの同士を
対応付けるのが自然であるから、投票値も波高値に応じ
て変化させる。すなわち投影波形から求められた局所的
ピークリストにおけるi番目のピークの波高値をAis、
キーとなる画像データの投影波形に対する局所的ピーク
リストにおけるj番目のピークの波高値をBjsとして、
例えば投票値Vを次の(11)式のように定める。
【0070】
【数11】
【0071】なお、(11)式の投票値を適用するため
には、局所的ピークの波高値の最大値が所定の値になる
ようにするなどの正規化処理を前もって行なっておく必
要がある。
【0072】このようにして(スケーリング補正量)−
(平行移動量)平面上に形成された累積投票値は、2つ
の局所的ピークリストの一致度を反映している。従っ
て、同平面上に形成された累積投票値のピーク点を探索
すれば、その点の座標が求める(スケーリング補正量,
平行移動量)を表す。この補正量を用いて一方の投影波
形に補正を加えることにより、2つの投影波形が最も良
く一致することになる。図6の例では(スケーリング補
正量,平行移動量)=(0.9,10)において(累積
投票値)=3の最大累積投票値を持つことから、登録文
書の投影波形を0.9倍し、さらに10だけ平行移動す
ることにより、2つの投影波形が最も良く一致する。
【0073】ところで、上記の補正量を適用すると、被
照合文書側の局所的ピークB3のみがデータベース内の
画像データに対応する局所的ピークを持たないことがわ
かる。このことから、局所的ピークB3は、文書上への
書き込みや押印等のノイズによるピーク成分であること
と推測される。本実施の形態の相似変換パラメータの検
出手続きでは、このようなノイズによる局所的ピークの
発生、あるいは検出漏れがあっても、投票処理という多
数決原理に基づいて相似変換パラメータが推定されるた
め、推定される補正量の精度の低下を防止できる。
【0074】以上の説明では、(スケーリング補正量)
−(平行移動量)平面上に形成された累積投票値のピー
ク点を探索することにより相似変換パラメータの検出を
行なったが、これは「理想的」な例であり、実際には局
所的ピーク検出時の誤差や、元々の文書の印刷精度など
により、投票を行なう直線群が厳密に一点で交わること
は希である。そこで、相似変換パラメータを推定する手
続きとして、(スケーリング補正量)−(平行移動量)
平面を、図7のようにスケーリング補正量方向にn分
割、平行移動量方向にm分割したセルに「量子化」し
て、各セルの投票値の累計を計算し、該累計が最大とな
るセルを求める方法も考えられる。そして当該累計が最
大となったセルの中心座標(kc,sc)を以って相似変
換パラメータの最尤値とする。このようにするとコンピ
ュータ処理にも適合できる。
【0075】さらに精度を高めるためには、図8に示す
ように、投票値の累計が最大となるセルを求めた後、投
票を行なう直線群の中から該セルを通過する直線群のみ
を選び、それら直線群から最短距離に位置する点の座標
を求め、当該座標を最尤値とする。このような点の座標
は以下の手順により求めることができる。
【0076】まず投票値の累計が最大となるセルを通過
する直線群がh本あるとして、それらが(12)式で表
されるとする。
【0077】
【数12】
【0078】ただしi=0,1,…,h−1とする。こ
れらの直線の一つと(スケーリング補正量)−(平行移
動量)平面上の一点(k,s)との距離diの間には次
の(13)式の関係がある。
【0079】
【数13】
【0080】点(k,s)から各直線までの距離の2乗
和Dは、次の(14)式で示される。
【0081】
【数14】
【0082】従って、投票値の累計が最大となるセルを
通過する直線群から最短距離に位置する点の座標(k
l,sl)は、次の(15)、(16)式を連立して解く
ことによって求めることができる。
【0083】
【数15】
【0084】さらに、直線群から最短距離に位置する点
の座標を求める際に、各直線からの距離を(11)式に
定めた投票値Vで重み付けしても良い。投票値Vによる
重み付けを行なうことにより、局所的ピークの対応付け
が正しく行われている可能性が高い直線を重視した補正
量検出が行なわれる。この場合、(14)式は、(1
7)式のように変更される。
【0085】
【数16】
【0086】(17)式において、Viはi番目の直線
上への投票値である。またピーク属性情報のうち、投影
波形の幅と重心の情報は相似変換パラメータの推定にお
ける処理の高速化や信頼性の向上に役立てることができ
る。
【0087】すなわち、一般に投票処理によるパラメー
タ推定では、不適切な位置に比較的大きなピークを生じ
る、いわゆるフォールスピーク(false peak)問題を有
している。この効果を軽減するためには、投票空間全体
への投票を行なうのではなく、明らかに必要ないと思わ
れる領域への投票を行なわないことが有効である。本実
施形態においては投影波形の幅と重心の情報を用いて投
票領域を限定することにより、変換パラメータ検出処理
を高速化すると同時に、上記問題による効果も軽減する
ことができる。
【0088】具体的に投影波形の幅を用いて、(スケー
リング補正量)−(平行移動量)平面上におけるスケー
リング補正量方向の投票領域を限定することができる。
データベース内の画像データの投影波形幅をWr、キー
となる画像データの投影波形幅をWiとして次の(1
8)式に示す投影幅比Rを求めると、相似変換パラメー
タにおけるスケーリング補正量はRに近い値となるはず
である。なぜなら2つの文書が同一の文書であるなら
ば、それらの投影波形も相似形をなしているはずであ
り、スケーリングの相違は投影幅の比となるはずだから
である。
【0089】
【数17】
【0090】投影波形の幅はノイズや紙の地色等による
オフセット分などに起因する誤差分を含んでいるが、そ
れでもなお、真の補正量、すなわち投票値のピーク位置
のスケーリング座標は、(18)式のRに近い値である
はずである。そこで(18)式のRを中心とした所定の
スケーリングマージンβを設定し、そのスケーリングマ
ージンβの範囲内に投票領域を限定する。この場合、
(スケーリング補正量)−(平行移動量)平面上に描画
した各直線のうち、当該スケーリングマージンβの範囲
内に「投票した」こととし、当該範囲の外に対しては
「投票」しない。
【0091】また、投影波形の重心位置情報からも投票
領域の限定を行なうことができる。すなわち、もし特徴
抽出手段により求められた重心位置が正確なものであれ
ば、2つの投影波形の重心位置間には(10)式と同様
に次の(19)式の関係が成立するはずである。
【0092】
【数18】
【0093】ただし、(19)式においてGrとGiはそ
れぞれ、データベース内の画像データの投影重心位置と
キーとなる画像データの投影重心位置である。実際には
求められた重心位置の情報にはノイズや紙の地色等によ
るオフセット分などに起因する誤差分を含んでいるが、
それでもなお、真の補正量、すなわち投票値のピーク位
置は(19)式で表される直線の近傍に位置するはずで
ある。そこで(19)式の直線を中心として、適当な平
行移動量マージンγを設定し、その範囲内に投票領域を
限定する。
【0094】これにより、投票領域を図9に示した範囲
に限定し、この領域外の直線上、あるいはそもそもこの
領域を通過しない直線上への投票処理を省略し、処理を
高速化するとともに、上記false peak問題による効果を
低減できる。
【0095】なお、こうして求められた相似変換パラメ
ータに基いて、投影波形の相似変換処理を行なうにあた
り、非サンプリング位置での信号を要する場合など、補
間処理を要するときには、広く知られている補間法とし
て最近傍法、線形補間法、cubic convolution(3次畳
み込み)法、スプライン補間法など様々なものを利用で
きる。本実施の形態の装置は特に特定の補間法に依存す
るものではないので、上に挙げた補間法のいずれを用い
てもよい。上記の補間法は多くの文献で解説されている
ため、その説明を省略する。
【0096】次に、上述の技法により推定された相似変
換パラメータを用いて相似変換した後の投影波形を比較
する方法について概説する。理想的には、一方の投影波
形を相似変換し、他方の投影波形と比較したとき、両画
像データが一致する場合には、これらの投影波形は厳密
に一致する。しかし、比較に係る両画像データが同一の
ものであっても、スキャナの読み取り精度や、キーとな
る画像データに押印や書き込みが行われている場合、さ
らには相似変換パラメータの算出誤差など、様々な理由
により両投影波形が厳密に一致することは少ない。ま
た、キーとなる画像データとして複写した後の画像デー
タを用いる場合、文書上にある写真やドローイングのよ
うな中間調領域の濃度値は大きく変化している場合が多
く、その投影波高値も安定しない場合が多い。従ってノ
イズ等による投影波形の変形や相似変換パラメータの誤
差、文書上の中間調領域に起因する投影波高値の変化な
どに対しても堅牢な方法で類似度の測定を行なう必要が
ある。
【0097】このような投影波形の照合方法として、本
実施の形態では投影波形の微分波形間の相関係数を用い
る。これは文書上にある中間調領域によって投影波形の
一部にオフセットが加えられていても、その微分波形は
ほとんど影響を受けることがないことに着目したもので
ある。投影波形の微分波形を生成する方法としては、本
来の微分波形を用いる以外にも(2)式で示したS
(x)を用いることもできる。(2)式のS(x)は投
影波形上の微小な凹凸の影響を受けにくいため、投影波
形照合にS(x)を用いると良好な結果が得られること
になる。
【0098】データベース内の画像データに対し、相似
変換を行い、その相似変換後の微分投影波形をqr
(x)、キーとなる画像データの微分投影波形をqi
(x)とすると、両者の相関係数rは次の(20)式の
ように求められる。
【0099】
【数19】
【0100】また、Lは波形の長さを表す。
【0101】このようにして水平・垂直の両方向に投影
波形を形成した場合、両方向の投影波形に対する相関係
数がそれぞれ求められる。出力する画像データの類似度
の情報としては、これら2つの相関係数を加味したもの
としても良いし、どちらか一方の方向に対して照合処理
を行なうだけで十分であることがわかっている場合は、
その方向の相関係数を類似度として扱ってもよい。
【0102】両方向の相関係数を加味して画像データの
類似度を求める例としては、水平・垂直方向について求
められた相関係数の和を類似度として出力するものがあ
る。また別の例として、2方向の相関係数の荷重和を類
似度とする方法もある。この場合、水平方向の相関係数
をrh、垂直方向の相関係数をrvとし、水平方向の相関
係数の重みをwh、垂直方向の相関係数の重みを1−wh
とすれば、出力すべき類似度は次の(21)式のように
表される。
【0103】
【数20】
【0104】どちらかの方向の相関係数が文書画像の違
いをより強く反映している場合には、(21)式によっ
てその方向により大きな重み付けをして類似度の計算を
行なうことにより、照合精度を向上させることができ
る。
【0105】さらに、相似変換パラメータの推定により
得られた補正量を類似度に反映させることもできる。こ
れは文書のマージン幅やスケールが大きく異なる場合に
別文書として扱いたい場合などに適する。この場合、水
平・垂直方向の相関係数やスケーリング補正量、平行移
動量などの荷重和により定義される合成変量Zを作り、
大量の文書サンプルを用いた判別分析により各重みを調
整することで、各文書を判別する判別関数を求めること
ができる。判別分析については多くの文献に解説されて
いるため、詳細は割愛する。
【0106】一方、両方向の相関係数を用いることな
く、どちらか一方向の相関係数を類似度として扱う場合
について説明する。一般に横書きの文書の場合、横方向
の投影には明確な凹凸が現れるが、縦方向の投影には明
確な凹凸が生じない場合が多い。このような場合、縦方
向の投影波形の照合結果からは文書を特定するための有
益な情報は得られないため、対象となる文書が縦書きで
あるか横書きであるかが予めわかっている場合には、一
方向のみの相関係数を用いて類似度の測定を行なった方
が好ましい。また、水平・垂直方向の局所的ピークリス
トに含まれるピーク数の多い方向のみを類似度測定に使
用するのも有効な方法である。
【0107】これによりキーとなった画像データに対
し、最も高い類似度を示す、データベース内に登録され
た画像データがキーとなった画像データと同一の文書で
あると判定されることになる。
【0108】なお、ここまでの説明では、相似変換パラ
メータの推定時に(スケーリング補正量)−(平行移動
量)平面上に形成された累積投票値が最大値を取るピー
ク点を探索し、そのピーク点の座標を(スケーリング補
正量,平行移動量)とする唯一の補正量として用いてき
た。しかし、上記平面上では大きな累積投票値を持つ点
が複数点形成されることも希ではなく、局所的ピーク検
出の過程で多少の誤りが含まれている場合は、累積投票
値において2位以下のピーク点に対応する補正量が正し
い補正量となる場合もある。このような場合を想定し
て、上記平面に形成された累積投票値の中で、所定複数
のピーク点を求め、それぞれのピーク点に対応する複数
通りの補正量で投影波形の変換処理を行なう方法も考え
られる。そして、上記複数通りの補正量を用いて変換処
理を行なった投影波形を用いて複数通りの類似度を測定
し、その最大類似度を最終的な類似度とすることで、よ
り確実な文書画像照合処理を行なうことが可能となる。
【0109】また、(スケーリング補正量)−(平行移
動量)平面上に形成された累積投票値が2つの投影波形
の一致度を反映しているという点に着目すれば、この投
票値自体を2つの投影波形の類似度と見なすことができ
る場合もある。もしも局所的ピークの誤検出、あるいは
検出漏れが無いことが保証できる場合は、上記投票値自
体を類似度として使用し、実際の投影波形を相似変換す
る必要がなく、また変換後の投影波形などを比較する処
理もする必要がない。
【0110】以上に、本実施の形態の画像照合装置の動
作原理を述べたので、以下、本発明の実施の形態に係る
画像照合装置の実装例について説明する。本実施の形態
の画像照合装置1は、一般的なパーソナルコンピュータ
を利用して実現でき、図10に示すように制御部11
と、記憶部12と、ストレージ13と、外部記憶部14
と、スキャナ部15と、表示部16とから基本的に構成
されている。
【0111】ストレージ13は、制御部11によって実
行されるオペレーティングシステム等の基本プログラム
のほか、画像照合プログラムがインストールされたプロ
グラム格納領域13aと、比較対象となる画像データが
蓄積したデータ格納領域13bとを含んでいる。
【0112】制御部11は、ストレージ13に格納され
ているプログラムを実行して各種処理を行う。本実施の
形態においては、この制御部11が、画像照合プログラ
ムに従い、本発明の演算手段、及び画像データの照合処
理を行う手段を実現している。すなわち、この制御部1
1は、キーとなる画像データがスキャナ部15から入力
されると、これを処理対象の画像データとして記憶部1
2に格納し、事前に設定された複数の経路に沿って画素
値を累算し、演算した経路の順に累算値系列として記憶
部12に格納する処理(演算処理)を実行する。また、
制御部11は、この累算値系列を利用してストレージ1
3に蓄積されている画像データと、処理対象の画像デー
タとを照合する処理を実行する。これらの処理について
は、後により詳しく述べる。
【0113】記憶部12は、制御部11のワークメモリ
として動作する。外部記憶部14は、画像照合プログラ
ムなどを格納したコンピュータ読み取り可能な記録媒体
(例えばCD−ROMやDVD−ROMなど磁気的乃至
光学的に情報を記録したもの)から当該画像照合プログ
ラムなどを読み取って制御部11に出力し、これにより
ストレージ13にインストールさせる処理を行う。
【0114】スキャナ部15は、光学的に紙媒体の原稿
を読み取り、これを画像データに変換して制御部11に
出力する。表示部16は、制御部11から入力される指
示に従い、種々の情報を表示する。
【0115】ここで制御部11の画像照合プログラムの
処理についてより詳しく説明する。なお、ストレージ1
3に蓄積されている画像データについては、予め累算値
系列の情報及びピーク位置テーブル(後にその演算方法
を説明する)が関連づけられて格納されているものとす
る。また、以下の説明では累算値の演算の経路は水平方
向及び垂直方向であるとし、順序は水平方向については
紙面上側から下側へ、垂直方向については左側から右側
へ走査した順序であるとする(図11)。図11では実
線が演算経路を示し、破線が経路の演算順序を示すため
に用いられている。
【0116】制御部11は、スキャナ部15からキーと
なる画像データ(処理対象画像データ)の入力を受けて
これを記憶部12に格納して図12に示す処理を開始
し、まず当該処理対象の画像データに対し図11(a)
に示すような水平方向に延びる複数の経路に沿って、当
該経路上の画素値を累算し、各経路での累算結果を演算
順に記憶部12に格納する(S1)。同様に図11
(b)に示したような垂直方向に延びる複数の経路に沿
って、当該経路上の画素値を累算し、各経路での累算結
果を演算順に記憶部12に格納する(S2)。これら処
理S1及びS2で累算した結果が本発明の累算値系列と
なる。ここでは第i番目の演算順序の経路に対する累算
値をpiと表すこととする。
【0117】この累算値を演算するにあたり、白黒画像
データであれば、白の点の画素値を「0」、黒の点の画
素値を「1」として累算すればよいし、中間調を含む多
値画像データであれば、例えば白を「0」、黒を「25
5」等とすればよい。さらにカラー画像データの場合
は、その濃度成分を分離して、該濃度画像を上記多値画
像と見なして投影値を計算する。濃度成分の分離は、広
く知られたカラー値の変換処理により行うことができ
る。
【0118】制御部11は、この累算値系列の情報に対
し、その高周波成分を除去する低域濾波の処理を行って
記憶部12に格納する(S3)。この処理は、例えば隣
接する経路の累算値の平均値を演算するなどの公知の処
理によって行うことができる。そして低域濾波後の累算
値系列について、所定のa(aは整数)の値を用い、
(2)式に対応するSi=(pi-a)−(pi+a)につい
てiを順次変化させながらその正負の変化点を見出し、
変化点となったiをピーク候補として取り出す。また、
各変化点のiの情報に、正から負へ変化した凸である
か、負から正へ変化した凹であるかを示すピーク属性の
情報を関連づけて、記憶部12に図13に示すようなテ
ーブルとして記憶する(S4)。そして(3)〜(6)
式に例示したような処理により、隣接ピークとの大きさ
の差乃至比に基づき、顕著でないピーク候補を処理S4
で生成したピーク候補のテーブルから削除し、ピーク位
置テーブルを生成する(S5)。
【0119】また、ここで制御部11は、累算値系列の
幅と重心とを(7)及び(8)式により求めて、ピーク
位置テーブルに関連づけて記憶部12に格納する(S
6)。この処理については、既に概説したものを離散的
に扱うことによりコンピュータ処理として実現できるの
で、詳しい説明を省略する。
【0120】ここまでの処理により、記憶部12には、
ピーク位置テーブルとして上記の局所的ピークリスト、
すなわち本発明の系列位置情報が格納されているように
なる。
【0121】次に、制御部11はストレージ13から画
像データを順次取り出して(S7)、記憶部12上に所
定のn×mの配列を記憶する領域を確保して、この領域
の値を「0」に初期化し(S8)、当該取り出した画像
データに関連するピーク位置テーブルと、処理S6にて
記憶部12に格納したピーク位置テーブルとを比較し
て、各ピーク位置の対応付け処理を実行する(S9)。
この処理は、各ピーク位置テーブル上のピークについて
その第1番目と第j番目、第2番目と第j+1番目、…
といったような対応付けをjを1から順次設定すること
によって行う。この処理S9ではそのうちの対応付けの
候補の一つを設定する。
【0122】そして制御部11は、処理S9で設定され
た対応付けの結果に基づき、(1)式(や(9)式)に
基づきスケーリング補正量kと、平行移動量sとの間の
関係式を見出して、処理S9にて確保した記憶領域上に
「描画」する(S10)。すなわち、スケーリング補正
量の最大値がK、平行移動量の最大値がSである場合、
(x,y)の位置にある記憶領域がK・x/n、S・y
/mの値に対応しているから、この記憶領域が(K・x
/n)×k+s=(S・y/m)の関係を満たす場合
に、この記憶領域内の値をインクリメント(投票)する
ことになる。これが上記の投票処理に相当する。またこ
こではインクリメントするだけでなく、(11)式によ
り演算される投票値Vを当該記憶領域の値に加算(投
票)して上書きしてもよい。
【0123】制御部11は、さらに処理S8で設定され
ていない他の組み合わせがあるか否かを判断し(S1
1)、他の組み合わせがあれば(Yesならば)処理S
9に戻って処理を続ける。また、他の組み合わせがなけ
れば(Noならば)、このn×mの記憶領域を参照し、
値が最も大きい記憶領域上の位置(xmax,ymax)を検
索する(S12)。そして、当該(xmax,ymax)に基
づき、スケーリング補正量k、及び平行移動量sを決定
し、処理S7で取り出した画像データについて補正処理
を行う(S13)。補正後の累算値系列λj(0≦j<
nk)は、n個の経路について得られた累算値系列pi
(0≦i<n)に対し、λj=plとして求められる。
ここでlは、l=Round((j−s)/k)となる
整数である。Round(x)はxを四捨五入した整数
を表すものとする。また、l<0、またはl≧nとなる
jについては、λj=0とする。
【0124】また、位置(xmax,ymax)に基づきスケ
ーリング補正量k及び平行移動量sを決定する場合に
は、その中心座標により、k=(K/n)×(xmax+
1/2)、s=(S/m)×(ymax+1/2)として
もよいし、(15)式、(16)式を連立して解く方法
によってもよい。なお、後者の場合、当該偏微分方程式
を解く方法としては、ニュートン法のような数値解法を
利用してもよいし、(13)式や(14)式を代入して
事前に解析的な解を求めておくこととしてもよい。さら
に、明らかに誤りとなる記憶領域上の位置(x,y)に
ついて、処理S12に先だって当該記憶領域上の位置
(x,y)に「0」を設定することも好適である。明ら
かに誤りであるか否かは、(18)式に対応した累算値
系列内の累算値の個数(系列長)の比によるスケーリン
グ補正量k方向への領域制限、(19)式により求めら
れる重心位置に基づく領域制限を利用することができ
る。またここでは処理S13の補正処理を処理S7で取
り出した画像データに対して行っているが、キーとなる
画像データに対して行ってもよい。この場合処理S31
のときとはスケーリング補正量は上記kの逆数となり、
平行移動量は、上記sと符号が反対のものとなる。
【0125】そして、この新たな累算値系列λiについ
て、処理S1,S2で演算したキーとなる画像データに
対する累算値系列との比較を行う、照合処理を実行する
(S14)。制御部11は、当該照合結果を処理S7で
取り出した画像データを識別する情報(例えば当該画像
データのファイル名など)に関連づけて記憶部12に格
納する(S15)。制御部11は、まだ取り出していな
い画像データがあるか否かを調べ(S16)、取り出し
ていない画像データがあれば(Yesならば)、処理S
6に戻って次の画像データに対して処理S7〜処理16
を行い(図12の(A))、取り出していない画像デー
タがなければ(すべての画像データに対して処理を行っ
たならば;Noならば)、記憶部12に格納された照合
処理の結果を表示部16に表示するよう指示して(S1
7)、処理を終了する。
【0126】なお、処理S17においては、照合処理の
結果、一致度の高い順にソートした画像データの一覧を
表示することが好ましい。また、各一覧には、画像デー
タのファイル名を含め、画像データをプレビューした
り、取り出して外部記憶部14に挿入された媒体にコピ
ーを保存できるようにしておくことが好適である。
【0127】また、制御部11による照合処理(処理S
14,S15)では、(20)式で示したような相関係
数を演算することによって求めることができる。つま
り、水平、垂直の各方向に対し、次の演算を行う。すな
わち、ηjについてその差分数列(隣接累算値間の差分
からなる系列)に相当するqr(j)と、キーとなる画像
データについての累算値系列piについてその差分数列
に相当するqi(i)を生成し、これについて系列長Lを
用いて、(20)式を演算する。こうして水平、垂直の
各方向についての相関係数rh及びrvが演算され、これ
らを利用して類似度Scoreをrh+rvとして、又は(2
1)式のようにして求め、この類似度を照合処理の結果
として処理S15にて記憶部12に格納することにな
る。
【0128】本実施の形態の装置によると、制御部11
が、スキャナ部15から入力される画像データを処理対
象として所定の複数の経路に順次沿って画素値を累算
し、当該累算(演算)順に累算値を配列した累算値系列
を用いてストレージ13に蓄積された画像データとの照
合を行い、その結果を表示部16に出力する。従って、
これを利用すると、回覧された文書を再利用したい場
合、これに書き込みや押印があっても、そのままスキャ
ナ部15で文書をスキャンして照合を行わせる。制御部
11の処理により、ストレージ13に蓄積された画像デ
ータとの照合が行われて、その結果が表示部16に表示
され、利用者はこの結果を参照して示された文書をスト
レージ13から取り出すことができる。
【0129】
【発明の効果】本発明によると、処理対象となった画像
データに対し、複数の所定経路の各々について、経路上
の画素値を累算し、各経路上の画素値を累算した結果を
経路の演算順に含んでなる累算値系列を用い、複数の画
像データ間の照合処理を行う画像照合装置としているの
で、画像データそのものを用い、その累算値系列という
ような特徴的な量を比較することで照合を実行すること
により、書き込みや押印等のノイズがあっても安定した
結果を得ることができ、OCR等テキストデータを抽出
する必要がなく、テキストのみからなる文書データ同士
をも照合することができる。
【図面の簡単な説明】
【図1】 ピーク位置の対応付けの概要に関する説明図
である。
【図2】 投影波形の大局的な凹凸の様子を検出するた
めの局所的ピーク検出方法を表す説明図である。
【図3】 局所的ピークを選別する手段の動作原理を示
す説明図である。
【図4】 投影波形の幅を検出するための処理を表す説
明図である。
【図5】 投影波形の幅を求めるための関数を表す説明
図である。
【図6】 ピークリストの一例を表す説明図である。
【図7】 相似変換パラメータを推定する手続きの概要
を表す説明図である。
【図8】 相似変換パラメータを推定する手続きの概要
を表す説明図である。
【図9】 投票領域の制限の一例を表す説明図である。
【図10】 本発明の実施の形態に係る画像照合装置の
構成ブロック図である。
【図11】 累算値系列の演算方向を表す説明図であ
る。
【図12】 画像照合装置の処理の一例を表すフローチ
ャート図である。
【図13】 ピークリストとしてのピーク位置テーブル
の内容の例を表す説明図である。
【符号の説明】
1 画像照合装置、11 制御部、12 記憶部、13
ストレージ、14外部記憶部、15 スキャナ部、1
6 表示部。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 処理対象となった画像データに対し、複
    数の所定経路の各々について、経路上の画素値を累算す
    る演算手段と、 前記各経路上の画素値を累算した結果を経路の演算順に
    含んでなる累算値系列を用い、複数の画像データ間の照
    合処理を行う手段と、 を含むことを特徴とする画像照合装置。
  2. 【請求項2】 請求項1に記載の画像照合装置におい
    て、 前記経路は、互いに直交する2つの軸方向のそれぞれに
    沿って複数配列され、各軸方向ごとに累算値系列が演算
    され、 前記照合処理を行う手段が、各軸方向ごとの累算値系列
    の比較により照合の処理を行うことを特徴とする画像照
    合装置。
  3. 【請求項3】 請求項1または2に記載の画像照合装置
    において、 前記照合処理を行う手段が、照合の対象となった各画像
    データについての累算値系列間の相似性に基づき、照合
    を行うことを特徴とする画像照合装置。
  4. 【請求項4】 請求項3に記載の画像照合装置におい
    て、 前記相似性を検出するために、照合の対象となった各画
    像データについて、それぞれの累算値系列内での累算値
    の変化が特徴的となる系列上の位置を表す、系列位置情
    報を生成し、当該各累算値系列に対する系列位置情報を
    比較して、少なくとも平行移動量を含んでなる相似変換
    パラメータを演算し、当該相似変換パラメータを用い
    て、各累算値系列の相似性を検出することを特徴とする
    画像照合装置。
  5. 【請求項5】 請求項4に記載の画像照合装置におい
    て、 前記相似変換パラメータには、さらに一次変換パラメー
    タを含むことを特徴とする画像照合装置。
  6. 【請求項6】 請求項4または5に記載の画像照合装置
    において、 前記累算値の変化が特徴的となる系列位置情報は、累算
    値のピーク位置のリストであることを特徴とする画像照
    合装置。
  7. 【請求項7】 請求項6に記載の画像照合装置におい
    て、 前記相似変換パラメータを決定するために、照合の対象
    となった各画像データのうち、相異なる画像データにつ
    いてのピーク位置のリストを参照し、各ピーク位置同士
    の組み合わせについて相似変換パラメータを推定し、前
    記組み合わせごとに推定された相似変換パラメータを含
    んでなる推定相似変換パラメータ群を生成し、当該推定
    相似変換パラメータ群に含まれる各推定相似変換パラメ
    ータに基づき、尤度の高いパラメータとして前記相似変
    換パラメータを決定することを特徴とする画像照合装
    置。
  8. 【請求項8】 処理対象となった画像データに対し、複
    数の所定経路の各々について、経路上の画素値を累算す
    る工程と、 前記各経路上の画素値を累算した結果を経路の演算順に
    含んでなる累算値系列を用い、複数の画像データ間の照
    合処理を行う工程と、 を含むことを特徴とする画像照合方法。
  9. 【請求項9】 コンピュータに、 処理対象となった画像データに対し、複数の所定経路の
    各々について、経路上の画素値を累算する工程と、 前記各経路上の画素値を累算した結果を経路の演算順に
    含んでなる累算値系列を用い、複数の画像データ間の照
    合処理を行う工程と、 を実行させることを特徴とする画像照合プログラム。
JP2001284095A 2001-09-18 2001-09-18 画像照合装置および画像照合プログラム Expired - Fee Related JP4140221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001284095A JP4140221B2 (ja) 2001-09-18 2001-09-18 画像照合装置および画像照合プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001284095A JP4140221B2 (ja) 2001-09-18 2001-09-18 画像照合装置および画像照合プログラム

Publications (2)

Publication Number Publication Date
JP2003091730A true JP2003091730A (ja) 2003-03-28
JP4140221B2 JP4140221B2 (ja) 2008-08-27

Family

ID=19107478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001284095A Expired - Fee Related JP4140221B2 (ja) 2001-09-18 2001-09-18 画像照合装置および画像照合プログラム

Country Status (1)

Country Link
JP (1) JP4140221B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008992A1 (ja) * 2004-07-22 2006-01-26 C4 Technology, Inc. カメラ付き携帯情報通信端末を用いたWebサイト接続方法
JP2007172077A (ja) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd 画像検索システム及び方法及びプログラム
JP2007304893A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304892A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304894A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
US7801392B2 (en) 2005-07-21 2010-09-21 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
US7856146B2 (en) 2005-03-10 2010-12-21 Fuji Xerox Co., Ltd. Image processing device, image forming device, image processing method and program
JP2011059961A (ja) * 2009-09-09 2011-03-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8923625B2 (en) 2008-09-04 2014-12-30 Fuji Xerox Co., Ltd. Original image searching device, original image searching method, and computer readable medium
JP2019057173A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008992A1 (ja) * 2004-07-22 2006-01-26 C4 Technology, Inc. カメラ付き携帯情報通信端末を用いたWebサイト接続方法
US7856146B2 (en) 2005-03-10 2010-12-21 Fuji Xerox Co., Ltd. Image processing device, image forming device, image processing method and program
US7801392B2 (en) 2005-07-21 2010-09-21 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
US8005300B2 (en) 2005-07-21 2011-08-23 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
JP2007172077A (ja) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd 画像検索システム及び方法及びプログラム
JP2007304892A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304894A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP4687557B2 (ja) * 2006-05-11 2011-05-25 富士ゼロックス株式会社 画像照合装置及びプログラム
JP4687558B2 (ja) * 2006-05-11 2011-05-25 富士ゼロックス株式会社 画像照合装置、画像照合方法及びプログラム
JP4692377B2 (ja) * 2006-05-11 2011-06-01 富士ゼロックス株式会社 画像照合装置、画像照合方法及びプログラム
JP2007304893A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
US8923625B2 (en) 2008-09-04 2014-12-30 Fuji Xerox Co., Ltd. Original image searching device, original image searching method, and computer readable medium
JP2011059961A (ja) * 2009-09-09 2011-03-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2019057173A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
JP4140221B2 (ja) 2008-08-27

Similar Documents

Publication Publication Date Title
JP5591578B2 (ja) 文字列認識装置および文字列認識方法
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
EP0543590B1 (en) Method for comparing word shapes
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6151423A (en) Character recognition with document orientation determination
US8422793B2 (en) Pattern recognition apparatus
CN101364267B (zh) 字符识别装置、字符识别方法及计算机产品
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
EP1914680A1 (en) Document/image searching method and program, and document/image recording and searching device
US7106904B2 (en) Form identification method
EP0965943A2 (en) Optical character reading method and system for a document with ruled lines and their application
US20080177764A1 (en) Document and/or Image Retrieval Method, Program Therefor, Document and/or Image Storage Apparatus, and Retrieval Apparatus
US20100191769A1 (en) Image search system, image search method, and storage medium
JPH05217019A (ja) ビジネスフォーム識別システム及び画像処理システム
JP2007172077A (ja) 画像検索システム及び方法及びプログラム
WO2001054054A9 (en) Word recognition using silhouette bar codes
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
CN115240213A (zh) 表格图像识别方法、装置、电子设备及存储介质
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN111612045B (zh) 一种获取目标检测数据集的通用方法
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
JP4541995B2 (ja) 図形認識方法
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
US6351560B1 (en) Apparatus, method, and program for locating an objective on a form and a recording medium for recording the program for locating the objective on the form

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050428

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140620

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees