JP2007280385A - パターンマッチング処理方法及び装置 - Google Patents
パターンマッチング処理方法及び装置 Download PDFInfo
- Publication number
- JP2007280385A JP2007280385A JP2007089519A JP2007089519A JP2007280385A JP 2007280385 A JP2007280385 A JP 2007280385A JP 2007089519 A JP2007089519 A JP 2007089519A JP 2007089519 A JP2007089519 A JP 2007089519A JP 2007280385 A JP2007280385 A JP 2007280385A
- Authority
- JP
- Japan
- Prior art keywords
- data
- pattern
- elements
- weight
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
【課題】 入力パターンデータを認識するのに、融通性が高く、認識能力に多様性を得る。
【解決手段】入力画像データ中から複数要素からなるパターンデータを抽出する。複数要素からなるテンプレートデータ、前記テンプレートデータに対応する複数要素からなる重みデータをメモリから読み出す。前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する。前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る。
【選択図】 図2
【解決手段】入力画像データ中から複数要素からなるパターンデータを抽出する。複数要素からなるテンプレートデータ、前記テンプレートデータに対応する複数要素からなる重みデータをメモリから読み出す。前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する。前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る。
【選択図】 図2
Description
この発明は、パターンマッチング処理方法及び装置に関するものであり、例えばOCR(optical character reader)に適用して有用である。
OCR(optical character reader)では、パターンマッチング処理により文字認識を行っている。パターンマッチング処理においては、入力画像から抽出した複数要素(複数画素データ)からなるパターンデータと、予め記憶手段に保持されているパターン判定用の複数要素(画素データ)からなるテンプレートデータとから、パターンの一致度合いを示す値を算出する。そして、算出された値を所定の閾値と比較することによって、入力画像に対応する所望のパターンが存在するか否かの判定出力を得る。
ここで、P(i,j)は、入力画像から一部の領域を切り出したパターンデータであり、Q(i,j)はパターン判定用のテンプレートデータである。また、iおよびjは非負の整数である。
パターンマッチング処理を行う技術を示す文献として、日本国特許第3572203号がある。この文献では、複数のテンプレートデータの特徴となる部分を合体させた共通テンプレートを作成している。この共通テンプレートと、入力画像から抽出した複数要素からなるパターンデータとの類似度を得るために、マッチング演算を行っている。この処理方法では、パターンマッチング処理を効率化できる。
パターンマッチング処理を行うときに、検出したいパターンに比べて線の太さや点の大きさ等の形状が若干異なる入力パターン(文字等)であっても、本来検出したいパターンと同一のパターンであると判定しなければならない。例えば同一文字であっても、線の太さが異なる複数の文字がある場合、これらの文字は、同一文字として判定しなければならない。このような場合、入力パターンデータと比較するテンプレートデータとして、線の異なる文字用の複数のテンプレートを用意すると、メモリ容量が大きくなり、またマッチング演算時間が多くなる。
特許第3572203号
そこで、一実施形態の目的としては、入力パターンデータを認識するのに、融通性が高く、認識能力に多様性があるパターンマッチング方法及び装置を提供することを目的とする。
入力画像データ中から複数要素からなるパターンデータを抽出し、予め記憶手段に保持されている複数要素からなるテンプレートデータを読み出し、前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読み出す。次に前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する。次に、前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る。
入力パターンデータを認識するのに、融通性が高く、認識能力に多様性が得られた。
以下、図面を参照してこの発明の実施の形態を説明する。図1は発明の一実施形態による装置を示している。
11は、例えばチャージドカプルドデバイス(CCD)を用いたラインセンサである。ラインセンサ11で読み取られた信号は、アナログデジタル変換回路12において、画像データに変換され、制御部13に取り込まれる。制御部13では、画像データを一旦、画像メモリ132に取り込む。画像メモリ132に取り込まれた画像データは、領域分割部133において、2値化される。
この2値化されたデータの中から、パターン領域切り出し処理部134において、さらに所定サイズ(テンプレートデータと同一サイズ)のパターンデータを取り出す。このパターンデータをP(i,j)と称する。
上記の切り出し処理は、二値化された画像の全面について、所定サイズの領域が1画素ずつインクリメントされながら行われても良い。又は、後段の処理がより効率的に行われるように、二値化されたパターンが存在する外形サイズを判定し、この外形サイズを含める所定サイズの領域だけを限定して切り出しても良い。
外形サイズの判定方法としては、図3に示すように、縦方向に、二値化されたパターンデータCHAの配列が連続する長さ(LV)を判定し、また、横方向に、二値化されたデータCHAの配列が連続する長さ(LH)を判定する。そして縦方向と横方向の長さが、予め定めている長さを満足する場合は、先の外形サイズ或いは所定サイズの領域Pを切り出すようにしてもよい。
上記のように切り出された所定サイズのパターンデータは、類似度計算部135において、テンプレートデータと比較され、類似度が計算される。テンプレートデータは、複数用意されている。また類似度計算時には、後述するように、テンプレートデータとの類似度判定処理の余裕、或いは融通性をもたせるために重みデータが用意されている。
類似度計算部135において判定された類似度判定結果は、判定結果処理部136に入力される。ここで、類似度判定結果が、閾値を超えている場合には、最終的にパターンデータのキャラクタが決定される。シーケンスコントローラ131は、上記の各ブロックがデータ処理を実行するシーケンス制御を行っている。137は、テンプレートデータ及び重みデータを格納しているメモリである。
図2には、上記した制御部13の動作をフローチャートで示している。ステップSA1で画像データが2値化される。
この2値化されたデータの中から、パターン領域切り出し処理が行われる、即ち、所定サイズ(テンプレートデータと同一サイズ)のパターンデータが取り出される。
次のステップSA3において、テンプレート番号kに初期値を与え、ステップSA4ではkが最大値Kに達したかどうかを判定する。ステップSA4で、kが最大値Kに達していた場合はパターン認識処理を終了する。
kが最大値Kに達していない場合、kに対応したテンプレートデータQ[k](i,j)を記憶手段、つまりメモリ137から読み出す(ステップSA5)。また、テンプレートデータに対応した重みデータW[k](i,j)をメモリ137から読み出す(ステップSA6)。これらのテンプレートデータおよび重みデータは、全く異なる種類のパターンである場合や、同一パターンで傾きが異なる場合等、用途に応じて使い分けができる。
図4には、テンプレートデータQ[0],Q[1]、・・・・Q[k]と重みデータW[0],W[1],・・・・・W[k]の一例を示している。テンプレートデータQ[0]は正常な姿勢で配列された文字の例であり、Q[1]は傾いて配置された文字の例である。重みデータは、文字の周囲の白い部分が重みを軽くされている。例えば黒の部分の重みが2、白の部分の重みが1とされている。
次に、類似度が所定値T[k]を超えているかどうかの判定が行われる(ステップSA8)。類似度が所定値T[k]を超えなかった場合、判定結果J[k]を0として(ステップSA10)、次のテンプレートとパターンデータPとの類似度を計算する(ステップSA11)。類似度が所定値T[k]を超えている場合は、判定結果J[k]を1とする(ステップSA9)。
上記した式(2)を用いる場合は、乗算や除算を行う必要があり、ハードウェアとして実装したときの回路規模が膨大になってしまう。
そこで、このような回路規模の増大を抑制するために、図5に示すフローチャートのような簡便な方法を用いても良い。すなわち、パターンデータP(i,j)とテンプレートデータQ[k](i,j)との要素毎の差D(i,j)の絶対値を求める(ステップSB1、SB2,SB3,SB4)。
その差D(i,j)と所定の閾値Td(i,j)との比較に基づいて、選択された値(差D(i,j))の総和を類似度Sw[k]とすることもできる。
即ち、差D(i,j)が所定の閾値Td(i,j)以下の場合は、類似していることであり、所定の閾値Td(i,j)超の場合は、非類似である。類似している場合には、重みデータA(i,j)を加算して、類似度Sw[k]とする。類似度Sw[k]は、j及びiが可変されて、所定のサイズ内の全画素がテンプレートデータの画素と比較される。
即ち、図2に戻って説明する。算出した類似度Sw[k]を、テンプレートデータに対応した閾値T[k]と比較し(SA8)、Sw[k]の値がT[k]以上のときは判定結果J[k]を1とし(SA9)、Sw[k]の値がT[k]未満のときは判定結果J[k]を0とする(SA10)。以上SA5〜SA10の処理を、記憶されている全てのテンプレートデータについて行う。
上記したように、テンプレートデータと重みデータとを組み合わせ、検出対象パターンのエッジ近傍の不安定部分(二値化結果が“1”になるか“0”になるかが不確定であり、かつ、どちらであっても大局的なパターンは同一である部分)の重みを小さくすることにより、1回のマッチング処理で外形サイズの異なる複数の類似パターンの検出が可能となる。
即ち、図6に示すように、テンプレートデータ61と、これに対応した重みデータ62が容易された場合、検出可能なパターンとしては、図6の右側に示すようなパターンを検出することが可能である。即ち、テンプレートに完全に一致するパターン63は勿論のこと、線幅が異なるパターン64、サイズが異なるパターン65を検出することが可能である。
このように、図6の例は、テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる。
これに対して、図7に示すように、検出対象パターンのエッジ近傍(および検出対象パターン部分)の重みを大きくする重みデータ71が用意されていてもよい。このような、重みデータ71が利用された場合、図7の右側に示すようなパターンを検出することが可能である。即ち、テンプレートに完全に一致するパターン63は勿論のこと、背景に網点、ゴミ等のノイズが存在する場合でも所望のパターンを精度良く検出することが可能となる。
このように図7の例は、テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とで重みの値が異なる。
この発明は、上記の実施形態に限定されるものではない。図8には別の実施の形態を示している。図1と同一部には同一符号を付して説明する。図6に示すようなデータを有するメモリ137A,図7に示すようなデータを有するメモリ137Bを用意し、操作部140からの操作により、切換えることができるようにしてもよい。つまり、背景にノイズが多い場合は、図7に示したような重みデータが適合し、線の太さが異なるような文字が多い場合には、図6に示すような重みデータがよい。さらに、これらの重みデータを組み合わせて使用してもよい。
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
11…ラインセンサ、12A/D変換回路、13…制御部、131…シーケンスコントローラ、132…画像メモリ、133…領域分割部、134…パターン領域切り出し処理部、135…類似度計算部、136…判定結果処理部、137…メモリ。
Claims (11)
- 入力画像データ中から複数要素からなるパターンデータを抽出し、
予め記憶手段に保持されている複数要素からなるテンプレートデータを読み出し、
前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読み出し、
前記パターンデータと前記テンプレートデータと前記重みデータとを用いて要素毎の演算を行い、
前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出し、
前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る、
パターンマッチング処理方法。 - 前記要素毎の演算は、
前記パターンデータと前記テンプレートデータと重みデータの要素同士の演算と、
前記パターンデータと重みデータの要素を用いた演算と、
前記テンプレートデータと重みデータの要素を用いた演算と、
を含むことを特徴とする請求項1に記載のパターンマッチング処理方法。 - 前記テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項1に記載のパターンマッチング処理方法。
- 前記テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項1に記載のパターンマッチング処理方法。
- 入力画像中から複数要素からなるパターンデータを抽出し、
予め記憶手段に保持されている複数要素からなるパターン判定用のテンプレートデータを読み出し、
前記テンプレートデータに対応して予め記憶手段に保持されている複数要素からなる重みデータを読し、
前記パターンデータと前記テンプレートデータとの要素毎の演算を行い、
各要素の演算結果と所定の第1の閾値との比較を行い、閾値以下の演算結果を得て、
前記閾値以下の演算結果に対して、対応する重みデータの加算を行うことによってパターンの一致度合いを表す類似値を算出し、、
前記類似値と第2の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かを判定出力を得る、
パターンマッチング処理方法。 - 前記テンプレートデータに対応する重みデータは、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項5に記載のパターンマッチング処理方法。
- 前記テンプレートデータに対応する重みデータは、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なることを特徴とする請求項5に記載のパターンマッチング処理方法。
- 入力画像データ中から複数要素からなるパターンデータを抽出するパターンデータ切り出し処理部と、
複数要素からなるテンプレートデータ、前記テンプレートデータに対応している複数要素からなる重みデータを予め保持したメモリと、
前記複数要素からなるテンプレートデータ、前記複数要素からなる重みデータと前記パターンデータと用いて要素毎の演算い、前記要素毎の演算結果の総和を用いて、パターンデータとテンプレートデータとの一致度合いを表す類似値を算出する類似度計算部と、
前記類似値を所定の閾値と比較することによって前記パターンデータと前記テンプレートデータとが一致するか否かの判定出力を得る判定処理部と、
を有したパターンマッチング処理装置。 - 前記メモリは、前記重みデータとして、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる重みデータと保持する請求項8に記載のパターンマッチング処理装置。
- 前記メモリは、前記重みデータとして、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なる重みデータを保持する請求項8に記載のパターンマッチング処理装置。
- 前記メモリは、
第1の種類の重みデータとして、パターン本体のエッジに相当する要素とそれ以外の要素とで重みの値が異なる重みデータを保持し、
第2の種類の重みデータとして、パターン本体およびその周囲に位置する要素とそれ以外の要素とで重みの値が異なる重みデータを保持し、
さらにいずれか一方の種類の重みデータを切り替え選択する操作部を有した請求項8に記載のパターンマッチング処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/396,535 US20070230793A1 (en) | 2006-04-03 | 2006-04-03 | Method and apparatus for pattern matching processing |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007280385A true JP2007280385A (ja) | 2007-10-25 |
Family
ID=38558991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007089519A Pending JP2007280385A (ja) | 2006-04-03 | 2007-03-29 | パターンマッチング処理方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070230793A1 (ja) |
JP (1) | JP2007280385A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257256A (ja) * | 2009-04-24 | 2010-11-11 | Nikon Corp | 画像処理装置、画像処理方法、および画像処理プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8184910B2 (en) * | 2008-03-18 | 2012-05-22 | Toshiba Tec Kabushiki Kaisha | Image recognition device, image recognition method, and image scanning apparatus having image recognition device |
WO2015195417A1 (en) * | 2014-06-20 | 2015-12-23 | Rambus Inc. | Systems and methods for lensed and lensless optical sensing |
CN105095897B (zh) * | 2015-07-29 | 2018-04-17 | 周秀芝 | 一种基于梯度图像和相似度加权的数字识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2933246A (en) * | 1955-11-09 | 1960-04-19 | Libman Max L | Reading machine |
US3124636A (en) * | 1960-04-29 | 1964-03-10 | fitzmaurice |
-
2006
- 2006-04-03 US US11/396,535 patent/US20070230793A1/en not_active Abandoned
-
2007
- 2007-03-29 JP JP2007089519A patent/JP2007280385A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257256A (ja) * | 2009-04-24 | 2010-11-11 | Nikon Corp | 画像処理装置、画像処理方法、および画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20070230793A1 (en) | 2007-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4372051B2 (ja) | 手形状認識装置及びその方法 | |
US8649608B2 (en) | Feature value extracting device, object identification device, and feature value extracting method | |
JP2006252162A (ja) | パターン認識装置及びその方法 | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
US6574351B1 (en) | Destination address area detection apparatus | |
WO2007063705A1 (ja) | パターン認識装置、パターン認識方法、およびパターン認識プログラム | |
US20180122097A1 (en) | Apparatus, method, and non-transitory computer-readable storage medium for storing program for position and orientation estimation | |
JP2010044438A (ja) | 特徴抽出装置、特徴抽出方法、画像処理装置、及び、プログラム | |
JP6754120B2 (ja) | プログラム、情報記憶媒体及び文字分割装置 | |
JP2008102814A (ja) | オブジェクト検出方法 | |
JP2007280385A (ja) | パターンマッチング処理方法及び装置 | |
WO2004079660A1 (ja) | 画像処理装置 | |
CN108710881B (zh) | 神经网络模型、候选目标区域生成方法、模型训练方法 | |
JP2008011135A (ja) | 画像処理装置および画像処理プログラム | |
JP2006252562A (ja) | 画像認識方法 | |
JP2006260359A (ja) | 生体情報処理装置および生体情報処理方法 | |
JP2007140729A (ja) | 物品の位置及び姿勢を検出する方法および装置 | |
JP2015187769A (ja) | 物体検出装置、物体検出方法及びプログラム | |
JP2005182098A (ja) | 合成画像を生成・表示する装置及び方法 | |
JP5773935B2 (ja) | シーンにおけるオブジェクトを分類する方法 | |
JP6724547B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
EP1394726A3 (en) | Image processing for pattern recognition using edge detection and projections along predetermined directions | |
Dinesh et al. | A split-based method for polygonal approximation of shape curves | |
JP2008134940A (ja) | 対象物検出装置、対象物検出方法および対象物検出プログラム並びにそのプログラムを記録した記録媒体 | |
JP2019021085A (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 |