JP5251489B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5251489B2
JP5251489B2 JP2008327160A JP2008327160A JP5251489B2 JP 5251489 B2 JP5251489 B2 JP 5251489B2 JP 2008327160 A JP2008327160 A JP 2008327160A JP 2008327160 A JP2008327160 A JP 2008327160A JP 5251489 B2 JP5251489 B2 JP 5251489B2
Authority
JP
Japan
Prior art keywords
image
area
target
reference point
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008327160A
Other languages
English (en)
Other versions
JP2010152457A (ja
Inventor
雅則 関野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008327160A priority Critical patent/JP5251489B2/ja
Priority to US12/466,055 priority patent/US8494272B2/en
Publication of JP2010152457A publication Critical patent/JP2010152457A/ja
Application granted granted Critical
Publication of JP5251489B2 publication Critical patent/JP5251489B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
2つの画像が合致するか否かを判断するマッチング処理の技術がある。これには次の2つの技術がある。
(1)画像から、既知のパターンを検出する技術。例えば、プリント基板等に印刷された文字、図形の検査等に用いられている。
(2)マッチング処理に基づいて文書を圧縮する技術。例えば、画像から文字・図形要素を抽出し、マッチング処理の結果、抽出されたパターンを辞書に登録し、辞書の画像及びパターンの描画位置を符号化することが行われている。具体例として、JBIG2(ITU−T T.88)におけるテキスト領域(Text Region)の処理が該当する。
(1)の場合、比較対象の画像サイズは一般的に固定である。
(2)の場合、任意サイズの文字・図形画像のマッチング処理を行わなければならない。
そして、(2)の場合、任意の文字・図形画像のマッチング処理は、主に次の2つの方法が併用される。
(2.1)グローバルテンプレートマッチング(global template matching)
2つの画像の画像全体の特徴量(面積、周辺長、重心、モーメント、孔数等)を比較するマッチング処理である。画像の詳細な特徴が失われるため、マッチング性能は劣るが、計算量は少ないという特性がある。
(2.2)ローカルテンプレートマッチング(local template matching)
2つの画像の局所的な特徴量(濃度、画素分布等)を比較するマッチング処理である。マッチング性能は高いが、計算量は多いという特性がある。
一般に、グローバルテンプレートマッチングは、スクリーニング(粗ぶるい)として、ローカルテンプレートマッチングは詳細なマッチングとして、併用される。
ローカルテンプレートマッチングに関連する技術として、例えば、特許文献1には、差異がわずかである文字同士の判定精度を向上させることができる文字画像の照合方法及び照合装置ならびにプログラムを提供することを課題とし、第1特徴量算出手段が、基準文字画像及び評価対象文字画像の背景領域のうち、文字領域に囲まれる閉鎖領域の数、位置及び面積を求め、第2特徴量算出手段が、基準文字画像及び評価対象文字画像の文字領域の開放端の数及び位置を求め、比較・判定手段が、基準文字画像における閉鎖領域の数、位置及び面積、ならびに開放端の数及び位置と、評価対象文字画像における閉鎖領域の数、位置及び面積、ならびに開放端の数及び位置とをそれぞれ比較して、基準文字画像及び評価対象文字画像の合致又は合致せずを判定することが開示されている。
また、例えば、非特許文献1には、ローカルテンプレートマッチングに関連する技術としてCSIS(Combined Size−Independent Strategy)が記載されている。
CSISでは、2つの画像を重心で位置合わせして排他的論理和(XOR)をとり、エラーマップを作成する。エラーマップの値が0、1の場合をそれぞれ白画素、黒画素と呼ぶ。次の3つの判断(AからC)を行う。
(A)画像が大きな場合(2つの画像のいずれかの縦もしくは横サイズが閾値以上(例えば12画素)の場合)、次のいずれかの条件(A1からA3)に該当する場合、2つの画像は合致しないと判断する。
(A1)エラーマップ中の黒画素が、閾値以上(例えば4画素)の黒画素に8近傍で接している場合
(A2)エラーマップ中の黒画素が、2個以上の黒画素に8近傍で接しており、それらの2個以上は8近傍で接していない場合
(A3)エラーマップ中の黒画素に対応する各元画像の画素が、8近傍で白もしくは黒で囲まれている場合
(B)画像が小さな場合(前記以外の場合)、次のいずれかの条件(B1からB3)に該当する場合、2つの画像は合致しない。
(B1)エラーマップ中に、2×2の黒画素がある場合
(B2)エラーマップ中の黒画素が、2個以上の黒画素に8近傍で接しており、それらの2個以上は8近傍で接していない場合
(B3)エラーマップ中の黒画素に対応する各元画像の画素が、4近傍で白もしくは黒で囲まれている場合
(C)前記いずれでもない場合、2つの画像は合致する。
特開2007−317033号公報 Ian H. Witten、Alistair Moffat 、Timothy C. Bell著、"Managing Gigabytes Second Edition"、Morgan Kaufmann、1999
本発明は、2つの画像が合致するか否かの判断を行う場合にあって、画像の解像度又はそのサイズに依存した判断になることを抑制するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、第1の画像と第2の画像を受け付ける画像受付手段と、前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の周囲長を計測する周囲長計測手段と、前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の面積を計測する面積計測手段と、前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する参照領域生成手段と、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致しているか否かを判断するための基準点を抽出する基準点抽出手段と、前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する合致判断手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記基準点抽出手段は、抽出する基準点を整数値で表される値とすることを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記合致判断手段は、前記参照領域生成手段によって生成された参照領域を含む領域の角に該参照領域の角を合致させた状態で、前記第1の画像と前記第2の画像が合致するか否かを判断することを特徴とする請求項2に記載の画像処理装置である。
請求項4の発明は、前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する第2の参照領域生成手段と、前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記第2の参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する第2の合致判断手段と、前記合致判断手段による判断結果と前記第2の合致判断手段による判断結果に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する第3の判断手段をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
請求項5の発明は、コンピュータを、第1の画像と第2の画像を受け付ける画像受付手段と、前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の周囲長を計測する周囲長計測手段と、前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の面積を計測する面積計測手段と、前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する参照領域生成手段と、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致しているか否かを判断するための基準点を抽出する基準点抽出手段と、前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する合致判断手段として機能させることを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、2つの画像が合致するか否かの判断を行う場合にあって、本構成を有さない場合に比べて、画像の解像度又はそのサイズに依存した判断になることを抑制できる。
請求項2の画像処理装置によれば、抽出する基準点を整数値で表される値としない場合に比べて、基準点を抽出するための処理時間を削減することができる。
請求項3の画像処理装置によれば、本構成を有さない場合に比べて、参照領域を用いた判断の処理時間を削減することができる。
請求項4の画像処理装置によれば、細線が含まれている画像に対しても、本構成を有さない場合に比べて、2つの画像が合致するか否かの判断誤りを抑制できる。
請求項5の画像処理プログラムによれば、2つの画像が合致するか否かの判断を行う場合にあって、本構成を有さない場合に比べて、画像の解像度又はそのサイズに依存した判断になることを抑制できる。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前であることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
本実施の形態である画像処理装置は、2つの画像内の対象画像が合致するか否かを判断するマッチング処理を行うものであって、図1に示すように、画像受付モジュール110、周囲長計測モジュール120、面積計測モジュール130、ウィンドウA生成モジュール140、比較モジュール150、出力モジュール160を有している。好適には、ローカルテンプレートマッチングとして用いられる。なお、ここで、合致とは、完全に一致する場合はもちろんのこと、マッチング処理の目的を満たす範囲で類似している場合も含む。
画像受付モジュール110は、周囲長計測モジュール120、面積計測モジュール130と接続されている。2つの画像(画像i、画像j)を受け付けて、その画像を周囲長計測モジュール120、面積計測モジュール130へ渡す。画像を受け付けるとは、グローバルテンプレートマッチングによる処理後の画像を受け取ること、スキャナで画像を読み込むこと、ファックスで画像を受信すること、画像データベース等から画像を読み出すこと等が含まれる。受け付けた画像には、マッチング処理の対象となる画像が含まれている。周囲長計測モジュール120、面積計測モジュール130へ渡す画像は2値画像であるが、受け付ける画像は多値画像(カラー画像を含む)であってもよい。多値画像の場合は、2値化処理を行う。また、前処理として、ノイズ除去、傾き補正、正規化等の処理を行ってもよい。対象画像の内容として、文字画像、図形画像等がある。本実施の形態の説明では、黒画素によって対象画像が構成されている場合について説明する。
周囲長計測モジュール120は、画像受付モジュール110、ウィンドウA生成モジュール140と接続されている。画像受付モジュール110によって受け付けられた画像i又は画像j内の対象画像の周囲長を計測する。例えば、周囲(白画素と黒画素の境界)を追跡して、その距離を計測する。また、画像i、画像jのいずれか一方の画像内における対象画像の周囲長を計測してもよいし、両方の対象画像の周囲長を計測してもよい。特に、グローバルテンプレートマッチングによる処理後の画像である場合は、全体として類似している場合であるので、一方の画像内の対象画像の周囲長の計測でよい。また、両方の画像内の対象画像の周囲長を計測する場合は、その平均の値を求めるようにしてもよい。そして、その計測した周囲長(1つ又は2つの周囲長)をウィンドウA生成モジュール140へ渡す。
面積計測モジュール130は、画像受付モジュール110、ウィンドウA生成モジュール140と接続されている。画像受付モジュール110によって受け付けられた画像i又は画像j内の対象画像の面積を計測する。例えば、対象画像の黒画素数をカウントする。また、画像i、画像jのいずれか一方の画像内における対象画像の面積を計測してもよいし、両方の対象画像の面積を計測してもよい。特に、グローバルテンプレートマッチングによる処理後の画像である場合は、全体として類似している場合であるので、一方の画像内の対象画像の面積の計測でよい。また、両方の画像内の対象画像の面積を計測する場合は、その平均の値を求めるようにしてもよい。そして、その計測した面積(1つ又は2つの面積)をウィンドウA生成モジュール140へ渡す。画像i、画像jのいずれか一方の画像内における対象画像の面積を渡す場合は、周囲長計測モジュール120に合わせる。
ウィンドウA生成モジュール140は、周囲長計測モジュール120、面積計測モジュール130、比較モジュール150と接続されている。周囲長計測モジュール120によって計測された周囲長と面積計測モジュール130によって計測された面積に基づいて、参照領域であるウィンドウを生成する。そして、生成したウィンドウを比較モジュール150に渡す。なお、ウィンドウは矩形であり、本実施の形態の説明では正方形の場合を説明する。
より具体的な例として、画像の解像度又はそのサイズに依存しないようにするために、ウィンドウのサイズを次のように決定する。
対象画像の面積をAとし、対象画像の周囲長をLとし、ウィンドウのサイズ(ウィンドウの1辺の長さ)をWとする。
W=k × A/L ただし、kは比例定数
つまり、面積(A)に比例して、周囲長(L)に反比例するように、ウィンドウのサイズ(W)を決定するようにしてもよい。
より具体的な例として、画像iの対象画像の面積をAiとし、画像jの対象画像の面積をAjとし、それぞれの周辺長をLi、Ljとする。
W=k × F(Ai/Li,Aj/Lj) ただし、kは比例定数
また、関数Fは、好適には、F(x,y) = min(x,y)である。つまり、より小さいサイズのウィンドウとなるようにする。
また、前記式内のkは、デフォルトとして予め定められた値であってもよいし、操作者の操作によって定められた値であってもよい。
比較モジュール150は、ウィンドウA生成モジュール140、出力モジュール160と接続されており、基準点抽出モジュール152、合致判断Aモジュール154を有している。比較モジュール150は、両画像の画素値の合致が最大となるように2つの画像を重ね、ウィンドウA生成モジュール140で生成されたウィンドウで走査する。各画像のウィンドウ内に含まれる画素の濃度を予め定められた方法で比較し、ウィンドウ位置毎に合致/合致せずを判定する。走査したウィンドウ位置で合致の結果(ウィンドウ内での合致の回数が予め定められた閾値以上であること、例えば、すべてのウィンドウ位置で合致すること)が得られた場合、2つの画像内の対象画像は合致すると判断する。それ以外の場合、2つの画像内の対象画像は合致せずと判断する。
基準点抽出モジュール152は、画像i内の対象画像と画像j内の対象画像が合致しているか否かを判断するための基準点を抽出する。つまり、それぞれの画像から合致判断の基準点を抽出する。ここで、基準点とは、画像i内の対象画像と画像j内の対象画像が合致しているか否かを判断するための位置合わせのための点である。具体例としては、画像iと画像jの各画像の画素値の合致が最大となる点である。より具体例として、画像又は対象画像の重心、中心等である。
さらに、この基準点は、量子化して整数としてもよい。つまり、基準点を画素の角(中心でもよい)となるようにしてもよい。
合致判断Aモジュール154は、画像iと画像jの基準点抽出モジュール152によって抽出された基準点を合致させ、画像iと画像jのウィンドウA生成モジュール140によって生成されたウィンドウ内の濃度に基づいて、画像i内の対象画像と画像j内の対象画像が合致するか否かを判断する。例えば、互いの画像の基準点を合致させるように座標系を移動させて、その状態でウィンドウを走査させながらそのウィンドウ内の互いの画像の濃度を比較して、対象画像が合致するか否かを判断する。
出力モジュール160は、比較モジュール150と接続されている。比較モジュール150による判断結果(画像i内の対象画像と画像j内の対象画像は合致するか否か)を受け取って、外部に出力する。例えば、判断結果を用いて画像の圧縮を行う圧縮装置、画像を認識する認識装置等に出力する。
第1の実施の形態は、例えば、図3に示すように相似図形に対しても、その合致判断の結果が異ならないようにしているものである。図3は、相似図形を対象とした合致判断処理例を示す説明図である。図3(a1)に示した文字画像「A」の縮小画像が、図3(a2)に示した文字画像「A」であり、図3(b1)に示した文字画像「A」の縮小画像が、図3(b2)に示した文字画像「A」である。第1の実施の形態では、図3(a1)に示した文字画像「A」と図3(b1)に示した文字画像「A」とが合致すると判断されたならば、それらの縮小画像である図3(a2)に示した文字画像「A」と図3(b2)に示した文字画像「A」とが合致すると判断される。逆に、図3(a1)に示した文字画像「A」と図3(b1)に示した文字画像「A」とが合致しないと判断されたならば、それらの縮小画像である図3(a2)に示した文字画像「A」と図3(b2)に示した文字画像「A」とが合致しないと判断される。相似図形であるならば、画像の解像度又はそのサイズが異なったとしても、その合致判断が異ならないようにしている。
また、長い線分に対しては、線の太さに比例して合致しやすさが変化するようにしているものである。図4は、太さの異なる長い線分を対象とした合致判断処理例を示す説明図である。図4(a)に示した線分と図4(b)に示した線分は、その長さ方向では合致するが、太さは異なるものであるにもかかわらず、合致すると判断する。
図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、画像受付モジュール110が、2つの画像を受け付ける。
ステップS204では、周囲長計測モジュール120が、2つの画像内の対象画像の周囲長を計測する。
ステップS206では、面積計測モジュール130が、2つの画像内の対象画像の面積を計測する。
なお、ステップS202とステップS204は、いずれが先に行われてもよいし、並列して処理されてもよい。
ステップS208では、ウィンドウA生成モジュール140が、ステップS204、ステップS206の計測結果に基づいて、ウィンドウを生成する。例えば、2つの画像内の対象画像の面積Ai、Aj、周囲長Li、LjからウィンドウサイズW1を次式で求める。
W1=k1 × min(Ai/Li,Aj/Lj) ただし、k1は比例定数
ステップS210では、基準点抽出モジュール152が、2つの画像内の各画素の画素値の合致が最大となる点を基準点として抽出する。図5は、基準点の例を示す説明図である。対象画像500aの重心である基準点510a、対象画像500bの重心である基準点510bをそれぞれ抽出する。
ステップS212では、合致判断Aモジュール154が、2つの画像を基準点で重ね、ステップS208で生成したウィンドウで走査する。図6は、2つの画像の基準点を合致させた場合の例を示す説明図である。これは、図5に示した例を重ね合わせたものである。つまり、基準点510aと基準点510bとを合致させて、対象画像500aと対象画像500bとを重ね合わせたものである。そして、基準点510aと基準点510bとを合致させた状態で、ウィンドウ600をそれぞれの画像内で走査させる。そのウィンドウ600内の濃度によって、ウィンドウ毎の合致/合致せずを判断する。
ステップS214では、出力モジュール160が、判断結果を出力する。
ステップS212のウィンドウ毎の合致/合致せずの判断処理例について詳細に説明する。
走査中のウィンドウ内部の、各画像の濃度D([0:1])が、次の条件(1、2)のいずれかを満たす場合に、2つの画像内の対象画像は合致せずと判断する。ここで、濃度Dとは、ウィンドウ内の画素の黒画素の数によって決定されるものである。例えば、黒画素数そのものであってもよいし、(黒画素数/ウィンドウ内の画素数)であってもよい。
1.|Di−Dj| ≧ Tdiff
2.Ci>0かつCj<0、もしくはCi<0かつCj>0
ただし、Cは次のように決定する。
C = 1(D > Tblack)
0(D ≧ Twhite かつ D ≦ Tblack)
−1(D < Twhite)
この関係を図7を用いて説明する。図7は、判断処理における閾値例を示す説明図である。濃度DがTblackより大きいならば、Cの値を1とする。濃度DがTwhite以上でTblack以下ならば、Cの値を0とする。濃度DがTwhiteより小さいならば、Cの値を−1とする。
なお、上記条件内で、「以上」、「以下」は、「より大」、「より小」としてもよいし、「より大」、「より小」は、「以上」、「以下」としてもよい。
そして、走査したウィンドウ位置で前記条件外(前記条件外となる回数が予め定められた閾値以上であること、例えば、すべてのウィンドウ位置で前記条件外)であれば、2つの画像内の対象画像は合致すると判断する。
なお、Tdiff、Tblack、Twhiteは予め定められた値であり、好適には、Tdiff=0.5、Tblack=pc、Twhite=1−pcである。pcは二次元正方格子のサイト過程における、パーコレーション閾値(pc≒0.5927)である。
パーコレーション閾値について説明する。二次元正方格子に、ランダムに点を描画する(これを二次元正方格子のサイト過程という)。濃度p>pcの場合に、系の端から端まで広がった一つのクラスター(互いに隣接する描画点のあつまり)が存在する場合、そのときのpcをパーコレーション閾値と呼ぶ(参照:D.スタウファー、A.アハロニー著、小田垣孝訳、「パーコレーションの基本原理」、吉岡書店、ISBN4−8427−0298−2)
次に、第2の実施の形態の例を説明する。
第2の実施の形態のモジュール構成例等は、第1の実施の形態のものと同等である。
第2の実施の形態の例では、基準点抽出モジュール152は、抽出する基準点を整数値で表される値とする。例えば、各画像の重心を抽出し、その重心を量子化(整数化)する。そして、その量子化した重心から、画素座標内で予め定められた閾値以内にある点から選択する。好適には、量子化した重心から、水平・垂直方向に±2画素以内の点から選択する。
次に、第3の実施の形態の例を説明する。
第3の実施の形態のモジュール構成例等は、第2の実施の形態のものと同等である。
第3の実施の形態の例では、合致判断Aモジュール154は、ウィンドウA生成モジュール140によって生成されたウィンドウを含む領域の角にそのウィンドウの角を合致させた状態で、画像iと画像jが合致するか否かを判断する。
図8は、ウィンドウと画像座標の関係例を示す説明図である。例えば、ウィンドウサイズWが3.5である場合、画像座標系における各格子点に対し、左上、右上、左下、右下の4点のいずれかを角とするウィンドウのみを走査すればよい。つまり、図8(a)に示す例は、ウィンドウ810a(図8(a)では太実線の矩形)を含む最小の整数値のサイズである対応領域800a(図8(a)では点線の矩形でサイズは4となる)とウィンドウ810aの左上の対応点820aを合致させた状態のものであり、図8(b)に示す例は、ウィンドウ810bを含む最小の整数値のサイズである対応領域800bとウィンドウ810bの右上の対応点820bを合致させた状態のものであり、図8(c)に示す例は、ウィンドウ810cを含む最小の整数値のサイズである対応領域800cとウィンドウ810cの左下の対応点820cを合致させた状態のものであり、図8(d)に示す例は、ウィンドウ810dを含む最小の整数値のサイズである対応領域800dとウィンドウ810dの右下の対応点820dを合致させた状態のものである。
次に、第4の実施の形態の例を説明する。
図11は、細線がある対象画像の例を示す説明図である。
本来、図11(a)に示す対象画像1100a(文字画像「E」)と図11(b)に示す対象画像1100b(文字画像「F」)は合致せずと判断されるべきものであるが、前述の実施の形態では、ウィンドウ(ウィンドウ1110a、ウィンドウ1110b)に対して相対的に細い線が存在する場合、その細線の部分の濃度が低くなり、合致すると判断される可能性がある。
そのため、第4の実施の形態では、前述の実施の形態の例による処理に、ウィンドウA生成モジュール140とは異なるマッチングパラメータ(比例定数kと、濃度比較方法)でのマッチング処理を追加し、そして、両方のマッチング処理で、合致という判断結果が得られた場合、2つの画像は合致すると統合的に判断する処理を追加する。
図9は、第4の実施の形態の構成例についての概念的なモジュール構成図である。
画像受付モジュール110、周囲長計測モジュール120、面積計測モジュール130、ウィンドウA生成モジュール140、ウィンドウB生成モジュール945、比較モジュール150、出力モジュール160を備えている。なお、第1の実施の形態(第2、3の実施の形態であってもよい)と同種の部位には同一符号を付し重複した説明を省略する。
ウィンドウB生成モジュール945は、周囲長計測モジュール120、面積計測モジュール130、比較モジュール150と接続されており、周囲長計測モジュール120によって計測された周囲長と面積計測モジュール130によって計測された面積に基づいて、ウィンドウBを生成する。そして、生成したウィンドウBを比較モジュール150に渡す。なお、ウィンドウA生成モジュール140で生成されたウィンドウをウィンドウAと称する。
より具体的な例として、画像iの対象画像の面積をAiとし、画像jの対象画像の面積をAjとし、それぞれの周辺長をLi、Ljとする。
W2=k2 × F(Ai/Li,Aj/Lj) ただし、k2は比例定数
また、関数Fは、好適には、F(x,y) = min(x,y)である。つまり、より小さいサイズのウィンドウとなるようにする。
また、前記式内のk2は、デフォルトとして予め定められた値であってもよいし、操作者の操作によって定められた値であってもよい。また、ウィンドウA生成モジュール140でウィンドウAを生成するために用いた比例定数k1とは異なる値であり、より好適にはk1より小さい値(k2 < k1)である。したがって、その場合、W2はウィンドウAのサイズW1より小さい値となる。
比較モジュール150は、ウィンドウA生成モジュール140、ウィンドウB生成モジュール945、出力モジュール160と接続されている。比較モジュール150は、基準点抽出モジュール152、合致判断Aモジュール154、合致判断Bモジュール956、統合判断モジュール958を有している。
合致判断Aモジュール154は、統合判断モジュール958と接続されており、その判断結果を統合判断モジュール958に渡す。
合致判断Bモジュール956は、統合判断モジュール958と接続されており、画像iと画像jの基準点抽出モジュール152によって抽出された基準点を合致させ、画像iと画像jのウィンドウB生成モジュール945によって生成されたウィンドウB内の濃度に基づいて、画像i内の対象画像と画像j内の対象画像が合致するか否かを判断する。
例えば、互いの画像の基準点を合致させるように座標系を移動させて、その状態でウィンドウBを走査させながらそのウィンドウB内の互いの画像の濃度を比較して、対象画像が合致するか否かを判断する。
より具体例として、走査中のウィンドウ内部の、各画像による排他的論理和(XOR)をとった画像の濃度Dxor([0:1])が、次の条件を満たす場合に合致せずとする。
Dxor > Txor
そして、走査したウィンドウ位置で前記条件外(前記条件外となる回数が予め定められた閾値以上であること、例えば、すべてのウィンドウ位置で前記条件外)であれば、2つの画像内の対象画像は合致すると判断する。
なお、Txorは予め定められた値であり、好適には、Txor = pcである。pcは前述のパーコレーション閾値である。
統合判断モジュール958は、合致判断Aモジュール154、合致判断Bモジュール956と接続されており、合致判断Aモジュール154による判断結果と合致判断Bモジュール956による判断結果に基づいて、画像i内の対象画像と画像j内の対象画像が合致するか否かを判断する。例えば、合致判断Aモジュール154及び合致判断Bモジュール956によって合致せずと判断された場合に、合致せずと判断する。いずれか又は両方によって合致すると判断された場合は、合致すると判断する。
図10は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1002からステップS1008までは、図2の例に示したフローチャート内のステップS202からステップS208と同等である。
ステップS1010では、ウィンドウB生成モジュール945が、ウィンドウBを生成する。
ステップS1012とステップS1014は、図2の例に示したフローチャート内のステップS210からステップS212と同等である。
ステップS1016では、合致判断Bモジュール956が、2つの画像を基準点で重ね、ステップS1010で生成したウィンドウBで走査して、各ウィンドウB毎で合致するか否かを判断する。
ステップS1018では、統合判断モジュール958が、ステップS1014とステップS1016の判断結果に基づいて、2つの画像内の対象画像が合致するか否かを判断する。
ステップS1020は、図2の例に示したフローチャート内のステップS214と同等である。
図12を参照して、前述の実施の形態の画像処理装置のハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1217と、プリンタなどのデータ出力部1218を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1201は、前述の実施の形態において説明した各種のモジュール、すなわち、周囲長計測モジュール120、面積計測モジュール130、ウィンドウA生成モジュール140、ウィンドウB生成モジュール945、比較モジュール150等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1204により相互に接続されている。
ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1206に接続されている。
キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作される入力デバイスである。ディスプレイ1210は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1211は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像受付モジュール110が受け付けた画像、周囲長計測モジュール120、面積計測モジュール130の測定結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1213に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、及びホストバス1204を介して接続されているRAM1203に供給する。リムーバブル記録媒体1213も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、及び外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図12に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 相似図形を対象とした合致判断処理例を示す説明図である。 太さの異なる長い線分を対象とした合致判断処理例を示す説明図である。 基準点の例を示す説明図である。 2つの画像の基準点を合致させた場合の例を示す説明図である。 判断処理における閾値例を示す説明図である。 ウィンドウと画像座標の関係例を示す説明図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態による処理例を示すフローチャートである。 細線がある対象画像の例を示す説明図である。 第1〜4の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
符号の説明
110…画像受付モジュール
120…周囲長計測モジュール
130…面積計測モジュール
140…ウィンドウA生成モジュール
150…比較モジュール
152…基準点抽出モジュール
154…合致判断Aモジュール
160…出力モジュール
945…ウィンドウB生成モジュール
956…合致判断Bモジュール
958…統合判断モジュール

Claims (5)

  1. 第1の画像と第2の画像を受け付ける画像受付手段と、
    前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の周囲長を計測する周囲長計測手段と、
    前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の面積を計測する面積計測手段と、
    前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する参照領域生成手段と、
    前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致しているか否かを判断するための基準点を抽出する基準点抽出手段と、
    前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する合致判断手段
    を具備することを特徴とする画像処理装置。
  2. 前記基準点抽出手段は、抽出する基準点を整数値で表される値とする
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記合致判断手段は、前記参照領域生成手段によって生成された参照領域を含む領域の角に該参照領域の角を合致させた状態で、前記第1の画像と前記第2の画像が合致するか否かを判断する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する第2の参照領域生成手段と、
    前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記第2の参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する第2の合致判断手段と、
    前記合致判断手段による判断結果と前記第2の合致判断手段による判断結果に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する第3の判断手段
    をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。
  5. コンピュータを、
    第1の画像と第2の画像を受け付ける画像受付手段と、
    前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の周囲長を計測する周囲長計測手段と、
    前記画像受付手段によって受け付けられた前記第1の画像又は第2の画像内の対象画像の面積を計測する面積計測手段と、
    前記周囲長計測手段によって計測された周囲長と前記面積計測手段によって計測された面積に基づいて、参照領域を生成する参照領域生成手段と、
    前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致しているか否かを判断するための基準点を抽出する基準点抽出手段と、
    前記第1の画像と前記第2の画像の前記基準点抽出手段によって抽出された基準点を合致させ、前記第1の画像と前記第2の画像の前記参照領域生成手段によって生成された参照領域内の濃度に基づいて、前記第1の画像内の対象画像と前記第2の画像内の対象画像が合致するか否かを判断する合致判断手段
    として機能させることを特徴とする画像処理プログラム。
JP2008327160A 2008-12-24 2008-12-24 画像処理装置及び画像処理プログラム Expired - Fee Related JP5251489B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008327160A JP5251489B2 (ja) 2008-12-24 2008-12-24 画像処理装置及び画像処理プログラム
US12/466,055 US8494272B2 (en) 2008-12-24 2009-05-14 Image processing device, image processing method, and computer readable medium for judging if images are matched

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008327160A JP5251489B2 (ja) 2008-12-24 2008-12-24 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2010152457A JP2010152457A (ja) 2010-07-08
JP5251489B2 true JP5251489B2 (ja) 2013-07-31

Family

ID=42266208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008327160A Expired - Fee Related JP5251489B2 (ja) 2008-12-24 2008-12-24 画像処理装置及び画像処理プログラム

Country Status (2)

Country Link
US (1) US8494272B2 (ja)
JP (1) JP5251489B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632159B (zh) * 2012-08-23 2017-05-03 阿里巴巴集团控股有限公司 训练分类器、图像中文字区域检测的方法及系统
CN104809462A (zh) * 2015-04-24 2015-07-29 电子科技大学 一种提取植被排放甲烷量的方法
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61201384A (ja) * 1985-03-04 1986-09-06 Toyota Central Res & Dev Lab Inc 刻印文字認識装置
US6370271B2 (en) * 1999-04-30 2002-04-09 Seiko Epson Corporation Image processing apparatus and methods for pattern recognition
JP4339221B2 (ja) * 2004-09-30 2009-10-07 Necインフロンティア株式会社 画像構成方法、指紋画像構成装置およびプログラム
WO2006054191A1 (en) * 2004-11-17 2006-05-26 Koninklijke Philips Electronics N.V. Improved elastic image registration functionality
US8194946B2 (en) * 2005-07-28 2012-06-05 Fujifilm Corporation Aligning apparatus, aligning method, and the program
JP2007317033A (ja) 2006-05-26 2007-12-06 Sharp Manufacturing System Corp 文字画像の照合方法および照合装置ならびにプログラム
JP4196302B2 (ja) * 2006-06-19 2008-12-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
US9239958B2 (en) * 2007-11-09 2016-01-19 The Nielsen Company (Us), Llc Methods and apparatus to measure brand exposure in media streams

Also Published As

Publication number Publication date
JP2010152457A (ja) 2010-07-08
US8494272B2 (en) 2013-07-23
US20100158381A1 (en) 2010-06-24

Similar Documents

Publication Publication Date Title
JP5887770B2 (ja) 画像処理装置及び画像処理プログラム
US8411955B2 (en) Image processing apparatus, image processing method and computer-readable medium
KR100903595B1 (ko) 조사 영역 추출 방법 및 화상 처리 장치
JP6075190B2 (ja) 画像処理方法及び装置
JP5251489B2 (ja) 画像処理装置及び画像処理プログラム
JP6303671B2 (ja) 画像処理装置及び画像処理プログラム
JP5742367B2 (ja) 画像処理装置及び画像処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP5724341B2 (ja) 画像処理装置及び画像処理プログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
US9325872B2 (en) Image processing apparatus
JP2010211699A (ja) 画像処理装置及び画像処理プログラム
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP2013161158A (ja) 画像処理装置及び画像処理プログラム
JP4978437B2 (ja) 画像処理装置及び画像処理プログラム
JP4930288B2 (ja) 画像処理装置及び画像処理プログラム
JP6252091B2 (ja) 画像処理装置及び画像処理プログラム
JP4872780B2 (ja) 画像処理システム及び画像処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP2009230603A (ja) 画像処理装置及び画像処理プログラム
US20150103363A1 (en) Image processing apparatus
JP6244805B2 (ja) 画像処理装置及び画像処理プログラム
JP2016053797A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Ref document number: 5251489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees