JP2007280385A - パターンマッチング処理方法及び装置 - Google Patents

パターンマッチング処理方法及び装置 Download PDF

Info

Publication number
JP2007280385A
JP2007280385A JP2007089519A JP2007089519A JP2007280385A JP 2007280385 A JP2007280385 A JP 2007280385A JP 2007089519 A JP2007089519 A JP 2007089519A JP 2007089519 A JP2007089519 A JP 2007089519A JP 2007280385 A JP2007280385 A JP 2007280385A
Authority
JP
Japan
Prior art keywords
data
pattern
elements
weight
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007089519A
Other languages
English (en)
Inventor
Takahiro Fuchigami
隆博 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Publication of JP2007280385A publication Critical patent/JP2007280385A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 入力パターンデータを認識するのに、融通性が高く、認識能力に多様性を得る。
【解決手段】入力画像データ中から複数要素からなるパターンデータを抽出する。複数要素からなるテンプレートデータ、前記テンプレートデータに対応する複数要素からなる重みデータをメモリから読み出す。前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する。前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る。
【選択図】 図2

Description

この発明は、パターンマッチング処理方法及び装置に関するものであり、例えばOCR(optical character reader)に適用して有用である。
OCR(optical character reader)では、パターンマッチング処理により文字認識を行っている。パターンマッチング処理においては、入力画像から抽出した複数要素(複数画素データ)からなるパターンデータと、予め記憶手段に保持されているパターン判定用の複数要素(画素データ)からなるテンプレートデータとから、パターンの一致度合いを示す値を算出する。そして、算出された値を所定の閾値と比較することによって、入力画像に対応する所望のパターンが存在するか否かの判定出力を得る。
パターンの一致度合いを示す値としては、次式(1)で表されるような類似度Sがよく用いられる。
Figure 2007280385
ここで、P(i,j)は、入力画像から一部の領域を切り出したパターンデータであり、Q(i,j)はパターン判定用のテンプレートデータである。また、iおよびjは非負の整数である。
パターンマッチング処理を行う技術を示す文献として、日本国特許第3572203号がある。この文献では、複数のテンプレートデータの特徴となる部分を合体させた共通テンプレートを作成している。この共通テンプレートと、入力画像から抽出した複数要素からなるパターンデータとの類似度を得るために、マッチング演算を行っている。この処理方法では、パターンマッチング処理を効率化できる。
パターンマッチング処理を行うときに、検出したいパターンに比べて線の太さや点の大きさ等の形状が若干異なる入力パターン(文字等)であっても、本来検出したいパターンと同一のパターンであると判定しなければならない。例えば同一文字であっても、線の太さが異なる複数の文字がある場合、これらの文字は、同一文字として判定しなければならない。このような場合、入力パターンデータと比較するテンプレートデータとして、線の異なる文字用の複数のテンプレートを用意すると、メモリ容量が大きくなり、またマッチング演算時間が多くなる。
特許第3572203号
そこで、一実施形態の目的としては、入力パターンデータを認識するのに、融通性が高く、認識能力に多様性があるパターンマッチング方法及び装置を提供することを目的とする。
入力画像データ中から複数要素からなるパターンデータを抽出し、予め記憶手段に保持されている複数要素からなるテンプレートデータを読み出し、前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読み出す。次に前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する。次に、前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る。
入力パターンデータを認識するのに、融通性が高く、認識能力に多様性が得られた。
以下、図面を参照してこの発明の実施の形態を説明する。図1は発明の一実施形態による装置を示している。
11は、例えばチャージドカプルドデバイス(CCD)を用いたラインセンサである。ラインセンサ11で読み取られた信号は、アナログデジタル変換回路12において、画像データに変換され、制御部13に取り込まれる。制御部13では、画像データを一旦、画像メモリ132に取り込む。画像メモリ132に取り込まれた画像データは、領域分割部133において、2値化される。
この2値化されたデータの中から、パターン領域切り出し処理部134において、さらに所定サイズ(テンプレートデータと同一サイズ)のパターンデータを取り出す。このパターンデータをP(i,j)と称する。
上記の切り出し処理は、二値化された画像の全面について、所定サイズの領域が1画素ずつインクリメントされながら行われても良い。又は、後段の処理がより効率的に行われるように、二値化されたパターンが存在する外形サイズを判定し、この外形サイズを含める所定サイズの領域だけを限定して切り出しても良い。
外形サイズの判定方法としては、図3に示すように、縦方向に、二値化されたパターンデータCHAの配列が連続する長さ(LV)を判定し、また、横方向に、二値化されたデータCHAの配列が連続する長さ(LH)を判定する。そして縦方向と横方向の長さが、予め定めている長さを満足する場合は、先の外形サイズ或いは所定サイズの領域Pを切り出すようにしてもよい。
上記のように切り出された所定サイズのパターンデータは、類似度計算部135において、テンプレートデータと比較され、類似度が計算される。テンプレートデータは、複数用意されている。また類似度計算時には、後述するように、テンプレートデータとの類似度判定処理の余裕、或いは融通性をもたせるために重みデータが用意されている。
類似度計算部135において判定された類似度判定結果は、判定結果処理部136に入力される。ここで、類似度判定結果が、閾値を超えている場合には、最終的にパターンデータのキャラクタが決定される。シーケンスコントローラ131は、上記の各ブロックがデータ処理を実行するシーケンス制御を行っている。137は、テンプレートデータ及び重みデータを格納しているメモリである。
図2には、上記した制御部13の動作をフローチャートで示している。ステップSA1で画像データが2値化される。
この2値化されたデータの中から、パターン領域切り出し処理が行われる、即ち、所定サイズ(テンプレートデータと同一サイズ)のパターンデータが取り出される。
次のステップSA3において、テンプレート番号kに初期値を与え、ステップSA4ではkが最大値Kに達したかどうかを判定する。ステップSA4で、kが最大値Kに達していた場合はパターン認識処理を終了する。
kが最大値Kに達していない場合、kに対応したテンプレートデータQ[k](i,j)を記憶手段、つまりメモリ137から読み出す(ステップSA5)。また、テンプレートデータに対応した重みデータW[k](i,j)をメモリ137から読み出す(ステップSA6)。これらのテンプレートデータおよび重みデータは、全く異なる種類のパターンである場合や、同一パターンで傾きが異なる場合等、用途に応じて使い分けができる。
図4には、テンプレートデータQ[0],Q[1]、・・・・Q[k]と重みデータW[0],W[1],・・・・・W[k]の一例を示している。テンプレートデータQ[0]は正常な姿勢で配列された文字の例であり、Q[1]は傾いて配置された文字の例である。重みデータは、文字の周囲の白い部分が重みを軽くされている。例えば黒の部分の重みが2、白の部分の重みが1とされている。
パターンデータPとテンプレートデータQ[k]と重みデータW[k]とから、重み付きの類似度Sw[k]を算出する(ステップSA7)。類似度の算出方法としては、例えば式(2)が用いられる。
Figure 2007280385
次に、類似度が所定値T[k]を超えているかどうかの判定が行われる(ステップSA8)。類似度が所定値T[k]を超えなかった場合、判定結果J[k]を0として(ステップSA10)、次のテンプレートとパターンデータPとの類似度を計算する(ステップSA11)。類似度が所定値T[k]を超えている場合は、判定結果J[k]を1とする(ステップSA9)。
上記した式(2)を用いる場合は、乗算や除算を行う必要があり、ハードウェアとして実装したときの回路規模が膨大になってしまう。
そこで、このような回路規模の増大を抑制するために、図5に示すフローチャートのような簡便な方法を用いても良い。すなわち、パターンデータP(i,j)とテンプレートデータQ[k](i,j)との要素毎の差D(i,j)の絶対値を求める(ステップSB1、SB2,SB3,SB4)。
その差D(i,j)と所定の閾値Td(i,j)との比較に基づいて、選択された値(差D(i,j))の総和を類似度Sw[k]とすることもできる。
即ち、差D(i,j)が所定の閾値Td(i,j)以下の場合は、類似していることであり、所定の閾値Td(i,j)超の場合は、非類似である。類似している場合には、重みデータA(i,j)を加算して、類似度Sw[k]とする。類似度Sw[k]は、j及びiが可変されて、所定のサイズ内の全画素がテンプレートデータの画素と比較される。
即ち、図2に戻って説明する。算出した類似度Sw[k]を、テンプレートデータに対応した閾値T[k]と比較し(SA8)、Sw[k]の値がT[k]以上のときは判定結果J[k]を1とし(SA9)、Sw[k]の値がT[k]未満のときは判定結果J[k]を0とする(SA10)。以上SA5〜SA10の処理を、記憶されている全てのテンプレートデータについて行う。
上記したように、テンプレートデータと重みデータとを組み合わせ、検出対象パターンのエッジ近傍の不安定部分(二値化結果が“1”になるか“0”になるかが不確定であり、かつ、どちらであっても大局的なパターンは同一である部分)の重みを小さくすることにより、1回のマッチング処理で外形サイズの異なる複数の類似パターンの検出が可能となる。
即ち、図6に示すように、テンプレートデータ61と、これに対応した重みデータ62が容易された場合、検出可能なパターンとしては、図6の右側に示すようなパターンを検出することが可能である。即ち、テンプレートに完全に一致するパターン63は勿論のこと、線幅が異なるパターン64、サイズが異なるパターン65を検出することが可能である。
このように、図6の例は、テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる。
これに対して、図7に示すように、検出対象パターンのエッジ近傍(および検出対象パターン部分)の重みを大きくする重みデータ71が用意されていてもよい。このような、重みデータ71が利用された場合、図7の右側に示すようなパターンを検出することが可能である。即ち、テンプレートに完全に一致するパターン63は勿論のこと、背景に網点、ゴミ等のノイズが存在する場合でも所望のパターンを精度良く検出することが可能となる。
このように図7の例は、テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とで重みの値が異なる。
この発明は、上記の実施形態に限定されるものではない。図8には別の実施の形態を示している。図1と同一部には同一符号を付して説明する。図6に示すようなデータを有するメモリ137A,図7に示すようなデータを有するメモリ137Bを用意し、操作部140からの操作により、切換えることができるようにしてもよい。つまり、背景にノイズが多い場合は、図7に示したような重みデータが適合し、線の太さが異なるような文字が多い場合には、図6に示すような重みデータがよい。さらに、これらの重みデータを組み合わせて使用してもよい。
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
この発明に係る一つの実施の形態を説明するために示したパターンマッチング処理装置の構成例を示す図である。 図1の装置の動作例を説明するために示したフローチャートである。 パターンデータの所定サイズを説明するために示した図である。 パターンデータに比較するためのテンプレートデータと重みデータとの例を説明するために示した図である。 図1の装置の他の動作例を説明するために示したフローチャートである。 テンプレートデータと重みデータとの例と、検出可能なパターンの例を説明するために示した図である。 テンプレートデータと重みデータとの例と、他の検出可能なパターンの例を説明するために示した図である。 この発明に係る他の実施の形態を説明するために示したパターンマッチング処理装置の構成例を示す図である。
符号の説明
11…ラインセンサ、12A/D変換回路、13…制御部、131…シーケンスコントローラ、132…画像メモリ、133…領域分割部、134…パターン領域切り出し処理部、135…類似度計算部、136…判定結果処理部、137…メモリ。

Claims (11)

  1. 入力画像データ中から複数要素からなるパターンデータを抽出し、
    予め記憶手段に保持されている複数要素からなるテンプレートデータを読み出し、
    前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読み出し、
    前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算を行い、
    前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出し、
    前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る、
    パターンマッチング処理方法。
  2. 前記要素毎の演算は、
    前記パターンデータと前記テンプレートデータと重みデータの要素同士の演算と、
    前記パターンデータと重みデータの要素を用いた演算と、
    前記テンプレートデータと重みデータの要素を用いた演算と、
    を含むことを特徴とする請求項1に記載のパターンマッチング処理方法。
  3. 前記テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項1に記載のパターンマッチング処理方法。
  4. 前記テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項1に記載のパターンマッチング処理方法。
  5. 入力画像中から複数要素からなるパターンデータを抽出し、
    予め記憶手段に保持されている複数要素からなるパターン判定用のテンプレートデータを読み出し、
    前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読し、
    前記パターンデータと前記テンプレートデータとの要素毎の演算を行い、
    各要素の演算結果と所定の第1の閾値との比較を行い、閾値以下の演算結果を得て、
    前記閾値以下の演算結果に対して、対応する重みデータの加算を行うことによってパターンの一致度合いを表す類似値を算出し、、
    前記類似値と第2の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かを判定出力を得る、
    パターンマッチング処理方法。
  6. 前記テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項5に記載のパターンマッチング処理方法。
  7. 前記テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項5に記載のパターンマッチング処理方法。
  8. 入力画像データ中から複数要素からなるパターンデータを抽出するパターンデータ切り出し処理部と、
    複数要素からなるテンプレートデータ、前記テンプレートデータに対応している複数要素からなる重みデータを予め保持したメモリと、
    前記複数要素からなるテンプレートデータ、前記複数要素からなる重みデータと前記パターンデータと用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する類似度計算部と、
    前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る判定処理部と、
    を有したパターンマッチング処理装置。
  9. 前記メモリは、前記重みデータとして、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる重みデータと保持する請求項8に記載のパターンマッチング処理装置。
  10. 前記メモリは、前記重みデータとして、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なる重みデータを保持する請求項8に記載のパターンマッチング処理装置。
  11. 前記メモリは、
    第1の種類の重みデータとして、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる重みデータを保持し、
    第2の種類の重みデータとして、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なる重みデータを保持し、
    さらにいずれか一方の種類の重みデータを切り替え選択する操作部を有した請求項8に記載のパターンマッチング処理装置。
JP2007089519A 2006-04-03 2007-03-29 パターンマッチング処理方法及び装置 Pending JP2007280385A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/396,535 US20070230793A1 (en) 2006-04-03 2006-04-03 Method and apparatus for pattern matching processing

Publications (1)

Publication Number Publication Date
JP2007280385A true JP2007280385A (ja) 2007-10-25

Family

ID=38558991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007089519A Pending JP2007280385A (ja) 2006-04-03 2007-03-29 パターンマッチング処理方法及び装置

Country Status (2)

Country Link
US (1) US20070230793A1 (ja)
JP (1) JP2007280385A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257256A (ja) * 2009-04-24 2010-11-11 Nikon Corp 画像処理装置、画像処理方法、および画像処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8184910B2 (en) * 2008-03-18 2012-05-22 Toshiba Tec Kabushiki Kaisha Image recognition device, image recognition method, and image scanning apparatus having image recognition device
WO2015195417A1 (en) * 2014-06-20 2015-12-23 Rambus Inc. Systems and methods for lensed and lensless optical sensing
CN105095897B (zh) * 2015-07-29 2018-04-17 周秀芝 一种基于梯度图像和相似度加权的数字识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2933246A (en) * 1955-11-09 1960-04-19 Libman Max L Reading machine
US3124636A (en) * 1960-04-29 1964-03-10 fitzmaurice

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257256A (ja) * 2009-04-24 2010-11-11 Nikon Corp 画像処理装置、画像処理方法、および画像処理プログラム

Also Published As

Publication number Publication date
US20070230793A1 (en) 2007-10-04

Similar Documents

Publication Publication Date Title
JP4372051B2 (ja) 手形状認識装置及びその方法
US8649608B2 (en) Feature value extracting device, object identification device, and feature value extracting method
JP2006252162A (ja) パターン認識装置及びその方法
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
US6574351B1 (en) Destination address area detection apparatus
WO2007063705A1 (ja) パターン認識装置、パターン認識方法、およびパターン認識プログラム
US20180122097A1 (en) Apparatus, method, and non-transitory computer-readable storage medium for storing program for position and orientation estimation
JP2010044438A (ja) 特徴抽出装置、特徴抽出方法、画像処理装置、及び、プログラム
JP6754120B2 (ja) プログラム、情報記憶媒体及び文字分割装置
JP2008102814A (ja) オブジェクト検出方法
JP2007280385A (ja) パターンマッチング処理方法及び装置
WO2004079660A1 (ja) 画像処理装置
CN108710881B (zh) 神经网络模型、候选目标区域生成方法、模型训练方法
JP2008011135A (ja) 画像処理装置および画像処理プログラム
JP2006252562A (ja) 画像認識方法
JP2006260359A (ja) 生体情報処理装置および生体情報処理方法
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置
JP2015187769A (ja) 物体検出装置、物体検出方法及びプログラム
JP2005182098A (ja) 合成画像を生成・表示する装置及び方法
JP5773935B2 (ja) シーンにおけるオブジェクトを分類する方法
JP6724547B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
EP1394726A3 (en) Image processing for pattern recognition using edge detection and projections along predetermined directions
Dinesh et al. A split-based method for polygonal approximation of shape curves
JP2008134940A (ja) 対象物検出装置、対象物検出方法および対象物検出プログラム並びにそのプログラムを記録した記録媒体
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置