JP2965165B2 - パターン認識方法及び認識用辞書作成方法 - Google Patents

パターン認識方法及び認識用辞書作成方法

Info

Publication number
JP2965165B2
JP2965165B2 JP2198259A JP19825990A JP2965165B2 JP 2965165 B2 JP2965165 B2 JP 2965165B2 JP 2198259 A JP2198259 A JP 2198259A JP 19825990 A JP19825990 A JP 19825990A JP 2965165 B2 JP2965165 B2 JP 2965165B2
Authority
JP
Japan
Prior art keywords
pattern
standard
cluster
feature
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2198259A
Other languages
English (en)
Other versions
JPH0484287A (ja
Inventor
真司 尾野
泰生 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2198259A priority Critical patent/JP2965165B2/ja
Publication of JPH0484287A publication Critical patent/JPH0484287A/ja
Application granted granted Critical
Publication of JP2965165B2 publication Critical patent/JP2965165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 発明の目的; (産業上の利用分野) 本発明は文字パターンの認識に際して、多段階のクラ
スタリングを利用したパターン認識方法及び装置並びに
そのパターン認識に用いる認識用辞書の作成方法に関す
る。
(従来の技術) 従来、高速なパターン認識を可能とする認識方式とし
て、特開平1−147685号公報に示される多段階のクラス
タリングを用いた文字認識方式が存在する。この文字認
識方式を第22図を用いて説明する。
認識に用いる辞書は、認識の第1段階で使用する大分
類(Aクラスタ)と第2段階で使用する分類(Bクラス
タ)との2段階で構成されている。第2段階のBクラス
タには各文字の標準特徴量が各文字毎に記載されてお
り、大分類(Aクラスタ)は、Bクラスタの各文字の特
徴量が相互に一定の類似関係にあるものを1つのグルー
プとして、各々複数のグループで構成されている。そし
て、大分類(Aクラスタ)の各グループ毎の代表標準特
徴量としては、例えばグループ内のJISコードの一番若
い文字の特徴量が使用されている。このような認識用辞
書を用いた文字認識の手順を説明すると、先ず第1段階
として認識すべき被読取文字の特徴量を検出し、その被
読取文字の特徴量と大分類(Aクラスタ)の各グループ
毎の代表標準特徴量とを比較照合し、最も類似するグル
ープを抽出し、そのグループに属する文字のいずれかで
あると判断する。そして、このグループを判別すると第
2段階に移り、当該グループ内の各文字の標準特徴量と
被読取文字の特徴量とを比較照合し、特徴量の最も類似
する文字であると判断し、その結果を認識結果として出
力するようになっている。
以上のように、文字認識に際して多段階のクラスタリ
ングを行なうことにより、高速な認識を実現している。
(発明が解決しようとする課題) しかしながら、上記従来の文字認識方式では、例えば
被読取媒体が読取りの際に変動(回転ずれ等)した場合
には、読取ったパターンの特徴量は、変動が生じていな
い場合と比べて多少ずれてしまい、大分類のクラスタリ
ングの際に、本来抽出するべきグループとは別のグルー
プを抽出してしまうことがある。
このような抽出ミスが生ずるのは、標準パターンの特
徴量が第1段階の分類内のものであっても、代表標準特
徴量に対して比較的類似度の低いパターンの場合であ
る。第23図を用いて具体的に説明すると、例えば“0"〜
“9"の文字の標準パターンの特徴量に基づいて大分類を
作成し、4つのグループ(No.1〜No.4)に分けることが
できたと仮定し、その代表標準パターンがグループNo.1
では「0」,グループNo.2では「3」,グループNo.3で
は「8」,グループNo.4では「1」になったとする。こ
の場合、例えば“7"はその代表標準パターン“1"の特徴
量を代表標準特徴量とするグループNo.4内であっても、
代表標準特徴量に対して比較的類似度の低い特徴量であ
るため、読取りの際に変動(回転,ずれ等)が生じると
検出した特徴量は「7」の標準特徴量に対してずれが生
じ、そのずれによってグループNo.4外となってしまった
り、又はグループNo.3に属すると判断してしまうことが
ある。同様のことがグループNo.2の「5」,グループN
o.3の「9」についても言える。このように、大分類で
分類を失敗してしまうと、第2段階で照合を行なっても
該当するものがなく認識不可能となってしまい、結局大
分類の分類の失敗が認識率の低下をもたらし問題となっ
ている。
本発明は上述のような問題に鑑みてなされたものであ
り、本発明の目的は、文字パターンの読取りの際に生じ
る変動(回転,ずれ等)を予め考慮して作成した認識用
辞書を用いてパターン認識を行ない、認識率の低下をも
たらすことなく、しかも高速でパターン認識を可能とす
るパターン認識方法及び装置並びにそのパターン認識に
用いる認識用辞書の作成方法を提供することにある。
発明の構成; (課題を解決するための手段) 本発明はパターン認識方法に関するものであり、本発
明の上記目的は、認識対象文字の標準的なパターンであ
る標準パターンを相互の類似関係によって分類構成した
ものに、画像読取の際に生ずるであろう変動を考慮した
変動パターンに対応する標準パターンが追加登録されて
いる複数のクラスターと、前記複数のクラスターそれぞ
れに属する追加登録された前記変動パターンに対応する
標準パターン以外の標準パターンから算出された各クラ
スターを代表するクラスター特徴量とで成る大分類辞書
と、前記標準パターンと、前記標準パターンに対応する
標準特徴量との対応関係が定められている中分類辞書と
を設け、読取った被認識パターンの特徴量である入力パ
ターン特徴量を抽出し、前記入力パターン特徴量と前記
大分類辞書に定められているクラスター特徴量とを比較
して前記被認識パターンが属するクラスターを判別し、
前記判別されたクラスター内の標準パターンについて、
前記中分類辞書に定められている前記標準特徴量と前記
入力パターン特徴量とを比較し、最も類似する標準パタ
ーンを認識結果として出力するようにすることによって
達成される。また、認識対象文字の標準的なパターンで
ある標準パターンを相互の類似関係によって分類構成し
たものに、画像読取の際に生ずるであろう変動を考慮し
た変動パターンに対応する標準パターンが追加登録され
ている複数のクラスターと、前記複数のクラスターそれ
ぞれに属する追加登録された前記変動パターンに対応す
る標準パターン以外の標準パターンから算出された各ク
ラスターを代表するクラスター特徴量とで成る大分類辞
書と、前記標準パターンと、前記標準パターンに対応す
る標準特徴量との対応関係が定められている中分類辞書
とを設け、読取った被認識パターンの特徴量である入力
パターン特徴量を抽出し、前記入力パターン特徴量と前
記大分類辞書に定められているクラスター特徴量とを比
較して前記被認識パターンが属するクラスターを判別
し、前記判別されたクラスター内の標準パターンについ
て、前記中分類辞書に定められている前記標準特徴量と
前記入力パターン特徴量とを比較し、類似する標準パタ
ーンを複数候補として抽出し、前記複数候補として抽出
された各標準パターンをそれぞれ複数のエリアに分割し
た際に、各エリアを比較して相違度の高いエリアを非類
似なエリアとして抽出し、前記非類似なエリアについて
候補として抽出された各標準パターンの標準特徴量と前
記入力パターン特徴量とを比較し、最も類似する標準パ
ターンを認識結果として出力するようにすることによっ
て達成される。さらに、本発明はパターン認識用辞書作
成方法に関するもので、本発明の上記目的は、認識対象
文字の標準的なパターンである標準パターンを画像入力
して、前記標準パターンの標準特徴量を抽出し、前記標
準特徴量に基づいて相互の類似関係により前記標準パタ
ーンを分類構成した複数のクラスターと、前記複数のク
ラスターのそれぞれに属する前記標準パターンの標準特
徴量から算出したクラスター特徴量とで成る分類辞書を
作成した後、前記画像入力に際して生ずるであろう変動
を考慮して作成された前記標準パターンに対する変動パ
ターンの特徴量である変動パターン特徴量を抽出し、前
記各クラスター特徴量と前記変動パターン特徴量とを比
較することによって前記変動パターンが前記複数のクラ
スター中のどのクラスターに属するかを判別し、判別さ
れたクラスター内に前記変動パターンに対応する標準パ
ターンが存在していない場合には、そのクラスター内に
その標準パターンを追加登録することによって達成され
る。
(作用) 本発明は小切手,手形等にチェックライタで記入され
た数字等を確実に認識するための方法及びその認識に最
も適した認識用辞書の作成方法を提供している。
請求項1の発明では、認識可能な文字の標準パターン
を類似するもの同士1つのグループとしてクラスターを
作成し、しかも各クラスター毎にクラスターを代表する
クラスター特徴量を定めた大分類辞書と、各標準パター
ン及びその特徴量である標準特徴量を定めた中分類辞書
とを予め作成してある。そして、これら辞書を用いて大
分類→中分類によって認識する。すなわち、被認識パタ
ーンの特徴量と大分類辞書のクラスター特徴量とを比較
照合し、被認識パターンがどのクラスターに属するかを
判別し、大まかな大分類を行なう。そして、大分類でク
ラスターが判別されると、クラスター内に属する標準パ
ターンであって中分類辞書に記憶されたその標準パター
ンに対応する標準特徴量と被認識パターンの特徴量とを
比較照合して中分類を行ない、最も類似する標準パター
ンを認識結果として出力する。このように多段階で認識
を進めて行くため、高速な認識が可能となる。また、被
認識パターンに読取の際に生ずる回転,ずれ等による変
動を考慮した変動パターンについても予め大分類辞書で
分類しておき、変動が生じた際にも正しく認識できるか
どうかを確認し、正しく認識できずに誤ったクラスター
と判別したときには変動パターンに対応する標準パター
ンを大分類辞書のそのクラスターに追加登録をしてあ
る。従って、被認識パターンの読取りの際に変動が生じ
ても大分類で失敗することはない。
請求項2の発明では中分類の段階で最終結果を出力せ
ずに、類似する複数の候補を挙げておき、この候補に挙
がった標準パターン間で非類似なエリアを抽出し、その
エリアで標準パターンの特徴量と被認識パターンの特徴
量とを比較照合するようにして、このエリアで最も類似
する標準パターンを認識結果として出力する。従って、
類似するパターンのうちどちらのパターンであるかの最
終判断が確実にできるので認識の誤りがなく、信頼性の
高い認識が可能となる。
請求項3の発明は、認識に用いる辞書の作成方法に関
するものである。先ず認識可能な標準パターンに基づい
てその類似性によって複数のクラスターを作成し、その
クラスター毎にクラスターを代表するクラスター特徴量
を定めて分類辞書を作成しておき、その作成後、画像の
読取の際に生ずるであろう変動を考慮して、標準パター
ンにその変動を加えた変動パターンを分類辞書に基づい
て予め分類を行なって、正しく分類できるかどうかを確
認しておき、正しく分類できずに誤ったクラスターに分
類されたときにはその対応する標準パターンをそのクラ
スターに追加登録しておく。このような方法を採用する
ことにより、クラスター特徴量は最初に辞書を作成した
ときのものをそのまま利用でき、変動等によって分類を
誤った場合にはただ単にクラスター内に誤ったパターン
に対応する標準パターンを追加登録するのみで済み、辞
書の更新が非常に簡単であり、しかもこの辞書による分
類失敗が減少し認識率が向上する。
(実施例) 以下に本発明の実施例を説明する。
本実施例は小切手,手形等に記入されている金額を認
識するためのものであり、最終的に認識すべき文字の種
類は数字の「0〜9」及び円記号「¥」,「*」等の終
桁符号の12種類である。第2図は手形の一例を示してお
り、中央部にチェックライタで金額を記入するための金
額記入欄1が設けられている。また、第3図は小切手の
一例を示しており、中央部にチェックライタで金額を記
入するための金額記入欄4が設けられている。本発明
は、これら手形又は小切手等の金額記入欄(1,4)にチ
ェックライタで記入される数字,円記号及び「*」等の
終桁符号を認識するものである。
先ず、本発明の認識に用いる認識用辞書について説明
する。
第1図は認識用辞書の作成動作を示す概略フローであ
り、第1図において、初めに標準パターン毎の標準特徴
量の抽出までの概略を説明すると、標準パターンについ
ての画像入力が行なわれ(ステップS1)、前処理として
スムージングが行なわれ(ステップS2)、その後に標準
パターン毎の標準特徴量の抽出が行なわれる(ステップ
S3)。ここで、標準パターン及びその画像入力,スムー
ジング処理,標準特徴量の抽出の工程を詳しく説明す
る。
標準パターンの種類は第6図に示すようなものであ
り、12種の文字に対して文字の形態を考慮して予め220
個のパターンが作成されている。かかる220個のパター
ンの各々が標準パターンであり、通常使用されている文
字形態の大部分が含まれている。画像入力はこの予め作
成された所定の大きさの標準パターンを、例えば24×24
画素の矩形範囲で各画素毎に濃度階調を8ビットの256
階調で読取っている。この入力された画像データの例が
第4図(A)であり、この画像データは前処理としてス
ムージング処理がなされるが、このスムージング処理を
次に説明する。
第7図はスムージング処理の動作例を示すフローチャ
ートであり、第8図〜第10図はその説明図である。スー
ムジング処理は第10図に示す3×3画素のスムージング
マスクを、入力画像データについて走査することにより
入力画像データの平滑化を行なっている。すなわち、先
ず第8図に示すように入力画像データの各画素毎の濃度
値に基づいて、その濃度値の画素数のヒストグラムを作
成し(ステップS20)、そのピークとなる濃度値を背景
濃度値(BP)として算出する(ステップS21)。これ
は、通常文字パターンは文字部分よりも背景部分が多
く、背景部分の濃度値は一定となるため、ピークとなる
濃度値(BP)が背景の濃度値となるからである。そし
て、第9図に示すように背景濃度値を24×24画素の周囲
に1画素配置し、26×26画素の画像データとする(ステ
ップS22)。これは、3×3画素のスムージングマスク
が24×24画素内の入力画素データの全てについて作用し
得るようにするためである。次に、26×26画素の画像デ
ータに第10図に示すスムージングマスクを走査し(ステ
ップS23)、入力画像データの平滑化を行ない、その結
果を以後の画像データとして使用する。この段階の画像
データの例が第4図(B)である。このようにスムージ
ング処理を行なっておくことにより、チェックライタで
の文字の刻印による模様を文字の濃度値で埋めることに
なり、文字刻印模様を消去することが出来る。よって、
安定な文字特徴が得られる利点がある。
次に、上述のようにしてスムージング処理された画像
データに対して標準特徴量の抽出を行なう(ステップS
3)。この標準特徴量の抽出動作を第11図〜第14図を参
照して説明する。
第11図は標準パターンの標準特徴量の抽出動作を示す
フローチャートであり、先ずスムージング処理された画
像データにロビンソン・オペレータを使用して各画素毎
に濃度勾配強度及び濃度勾配方向を求める(ステップS3
0〜S32)。ロビンソン・オペレータを示すのが第12図で
あり、3×3画素の各画素に重みが付けられている8種
類のマスクM0〜M7で成っており、各マスクM0〜M7はその
マスクが有する方向の勾配強度を抽出するためのもので
ある。例えばマスクM0により画像データを走査すれば、
各画素毎に↑方向の勾配強度(EP0)が求められる。こ
のように、8方向のマスクM0〜M7を用いて画像データを
走査することによって、各画素毎に各方向毎の濃度勾配
強度(EP0〜EP7)を求めることができる(ステップS3
0)。なお、濃度勾配強度EP0〜EP7はそれぞれマスクM0
〜M7に対応している。このようにして各画素毎に求めた
濃度勾配強度(EP0〜EP7)の中から最大値(EPi)を求
める(ステップS31)。そして、最大値(EPi)をその画
素の濃度勾配強度とし、その最大値EPiに対応する方向
を濃度勾配方向とする(ステップS32)。第4図(C)
に、このようにして求めた画像データを示す。
次に、このようにして求めた各画素毎の濃度勾配強度
に関して2値化処理を行なう(ステップS33,S40〜S4
3)。第13図を参照して、2値化処理のためのしきい値
を決定する方法を説明する。先ず全ての画素の中から濃
度勾配強度の最大値(EPmax)を求め(ステップS33)、
この最大値(EPmax)が所定の範囲にあるとことをチェ
ックし(ステップS40)、それ以外の値があると画像入
力ミスとしてエラー処理をする(ステップS41)。これ
により、画像処理の初期の段階で画像入力ミスを発見で
きる。そして、最大値(EPmax)が所定範囲内であれ
ば、この1/8のEPmax/8をしきい値(EPTH;以下「有効レ
ベルしきい値」という)とする(ステップS42)。そし
て、各画素の濃度勾配強度(EPi)が有効レベルしきい
値(EPTH)より大きければその画素の濃度勾配強度を
“1"とし、有効レベルしきい値(EPTH)より小さければ
その画素の濃度勾配強度を“0"とする(ステップS4
3)。これにより、各画素の濃度勾配強度は“0"又は
“1"の2値化が行なわれる。この2値化された画像デー
タの例が第4図(D)であり、更にこれに濃度勾配方向
も合せて表示した例が第4図(E)である。
次に、第14図の(A)に示すようにこの2値化された
画像データを(i×j)等分し、複数のエリアに区分す
る(ステップS44)。ここでは、4×4の16のエリア(S
Px[i][j][k]i=0〜3,j=0〜3)に区分し
た場合を示している。但し、iは水平方向の区分番号,j
は垂直方向の区分番号,xは標準パターンの番号である。
そして、第14図(B)のように各エリア毎に濃度勾配方
向毎の濃度勾配強度の総和(SPx[i][j][k];i
=0〜3,j=0〜3,k=0〜7)を求める(ステップS4
5)。但し、kは濃度勾配方向である。このようにして
求められた値SPx[i][j][k]が標準パターンの
標準特徴量であり、i×j×k(=128)次元のベクト
ル量である。以上の工程によって標準パターンの標準特
徴量が求められる。そして、1つの標準特徴量について
所定回数、例えば同一の10個の標準パターンにより各々
特徴量を求め、その平均値をその標準パターンの正規の
標準特徴量として記憶する(ステップS3)。
第1図において、220個の全ての標準パターンについ
て同様にして標準特徴量(SPx[i][j][k])を
求める(ステップS4)。次に、各標準パターンの標準特
徴量SPx[i][j][k]に基づいて大分類辞書を作
成する(ステップS5)。大分類辞書の内容は第15図に示
すようになっており、この大分類辞書は各標準パターン
の標準特徴量が一定の類似関係にあるものを1つの小集
団(以下、クラスターとする)として、複数のクラスタ
ーから構成されている。具体的には標準特徴量に基づい
て一般に知られているクラスター分析法、例えばウォー
ド法でクラスターを作成する。すなわち、標準パターン
の標準特徴量間の類似度を示すシティーブロック距離
(Dist)を全ての標準パターンの組合せについて、次の
(1)式により求める。
そして、全ての組合せについてシティブロック距離を
算出した結果、距離が最も小さいもの同士を1つのクラ
スターとし、そのクラスターに属する標準パターンの標
準特徴量の平均値をそのクラスターの特徴量とする。次
に、再度クラスター及びその他の標準パターンとの全て
の組合せについて特徴量のシティーブロック距離を算出
し、距離の最も小さいものを1つのクラスターとする。
以下、同じ動作をシティブロック距離が所定値以下、例
えば100以下になるまで、又はクラスターの数が所定
数、例えば50個になるまで繰返す。このように、ウォー
ド法により標準パターンの標準特徴量の類似度によりク
ラスター分けされたものが大分類辞書である。
更に各クラスター毎に特徴量が定められる。これをク
ラスター特徴量という。クラスター特徴量(CSPn[i]
[j][k];但し、nはクラスター番号)は、各クラ
スターに属する標準パターンの標準特徴量の平均であ
る。後述するように、実際の認識の際にはこのクラスタ
ー特徴量に基づいて大分類が行なわれるのであり、この
クラスター特徴量とクラスターとの対応関係が大分類辞
書である。なお、この段階の大分類辞書の例が第15図に
示すものである。これに対し、中分類辞書は各標準パタ
ーンとその標準特徴量との対応関係を示すものである。
第15図の1つについて説明しておくと、例えばクラスタ
ー[14]ではこのクラスターに属する標準パターンはb3
の「3」,b5の「5」であり、又、このクラスターのク
ラスター特徴量CSP14[i][j][k]はb3の標準特
徴量SPb3[i][j][k]とb5の標準特徴量SR
b5[i][j][k]の平均値となっている。
次に、第15図の大分類基本辞書に変動パターンの追加
登録をする動作について、第1図のステップS10以下で
説明する。変動パターンは、認識用辞書が実際に使用さ
れる認識装置の被認識媒体(文字パターン)の読取精度
に応じて決められている。具体的には、認識装置で被認
識媒体の読取精度が回転量で±4度、ずれ量では±1画
素(0.25mm)であったとすると、その変動パターンは例
えば回転の場合のものとして−4度,−3度,−2度,
−1度,+1度,+2度,+3度,+4度、ずれの場合
で−1画素,+1画素の10種類の変動パターンが標準パ
ターン(220個)に対して各々作成する。その一例を、
文字“0"について第16図に示す。すなわち、第16図
(A)の標準パターンに対して、変動パターンは同図
(B)の如く示される。又、この実施例では回転とずれ
とを別々にして変動パターンを作成しているが、回転
“−4度”でずれ“−1画素”のように回転とずれを組
合せた変動パターンを加えておくこともできる。
操作部により、画像入力される変動パターンに対応す
る標準パターンのパターン信号を入力し、その変動パタ
ーンを画像入力する(ステップS10)。入力された画像
データには標準パターンを入力したときと同様にスムー
ジング処理を行ない(ステップS11)、その後に変動パ
ターン特徴量(VPx[i][j][k])を求め(ステ
ップS12)、この特徴量に基づいて大分類辞書により大
分類の分類を行なう。大分類は、大分類辞書の各クラス
ターのクラスター標準特徴量(CSPn[i][j]
[k])と変動パターン特徴量(VPx[i][j]
[k])との類似度(Distn)を下記(2)式により算
出し(ステップS13)、最も類似度の高い(Distnが最小
となる)クラスターに属すると判断する(ステップS1
4)。
そして、判断されたクラスター内にその変動パターン
に対応する標準パターンが既に登録されているかどうか
をチェックし(ステップS15)、登録されていなけれ
ば、そのパターンをそのクラスター内に追加登録する
(ステップS15,S17)。登録は標準パターンに対応する
パターン番号のみで、既に登録されておれば次の変動パ
ターンについて上記動作を行なう。上述のような変動パ
ターンの追加登録動作は、標準パターン(220個)に対
応する変動パターンの全てについて行ない、全て終れば
終了となる。なお、変動パターンの追加登録の際には標
準パターンのパターン番号をクラスター内に追加登録す
るのみで、大分類に使用するクラスター特徴量について
は更新しない。これは、既存の220個とは別の新規の標
準パターン追加時に、再度全標準パターン内での大分類
の必要性がなくなる上、クラスター特徴量の鈍化を防
ぎ、クラスター内のクラスター特徴量の類似性の差の拡
大を行なうためである。
次に、上記変動パターンの追加登録の際には、後述す
る詳細分類で使用するパターン毎の各エリア毎の重みを
算出しているが(ステップS18,S18A,S19)、これについ
て説明する。これは画像入力の際に変動が生じた場合で
あっても、どのエリアが変動による影響が少ないかを予
め調べておくためである。この算出動作を第17図に従っ
て説明する。
大分類辞書の作成時に処理された標準パターン番号x
の入力文字のn個の変動パターン特徴量(VPx,p[i]
[j][k])(P:文字変動パターン番号1〜n)に対
し、4×4のメッシュエリア(i,j)毎の平均特徴量▲
▼[i][j][k]及びそのエリア毎の特徴量分
散σx 2[i][j]を次の(3)及び(4)式により算
出し、エリア毎の特徴量分散σx 2[i][j]の逆数を
重みWTx[i][j]として記憶しておく。全変動パタ
ーンについて特徴量の算出が終了すると、算出された変
動パターン特徴量VPx[i][j][k]のメッシュエ
リア(i,j)毎の平均特徴量▲▼及び特徴量分散σx
2を下記(3)及び(4)に従って算出する(ステップS
50)。そして、特徴量分散σx 2の逆数を重みWTx[i]
[j]とし(ステップS51)、重み辞書登録する(ステ
ップS52)。この重みWTx[i][j]の大きいエリア
が、画像入力の際に変動が生じてもその影響の少ない安
定したエリアである。
第18図が変動パターンを追加登録したこの段階の大分
類辞書の例であり、第15図の大分類辞書と比較すると、
例えばクラスターNo.14では“e3,e5,b8,o8"の4個の標
準パターン番号が追加登録されているのが分る。なお、
第18図に示す大分類辞書が実際のパターン認識の際に使
用されるものである。ここで、大分類辞書とは類似する
文字集団であるクラスターと、そのクラスターがもつク
ラスター特徴量との対応関係を示すものであり、大分類
辞書に基づく大分類とは被認識文字の特徴量とクラスタ
ー特徴量とを比較し、被認識文字がどのクラスターに属
する文字であるかを判別する処理である。
次に、上記認識用辞書を用いた場合の文字パターン認
識動作について第19図の機能ブロック図に基づいて説明
する。
先ず画像入力部10の画像センサで、例えば第3図に示
す小切手の金額記入欄4の画像を入力する。この金額記
入欄4は予め定められた位置であり、この欄内の濃淡濃
度を256階調で画像センサにより取得する。第5図
(A)が金額記入欄4の原画を示している。このように
取得された画像データを前処理部11でスムージングして
平滑化を行なう。この結果第5図(B)のようになり、
スムージング処理された画像データに基づき文字切出部
12は文字の切出しを行なう。文字の切出しは上述したロ
ビンソン・オペレータにより画像データを走査し、水平
方向については左方向成分(第4図(F))及び右方向
成分(第4図(F))を持つ画素のヒストグラムにより
切出し座標を抽出する。その結果、第5図(E)の左方
向ヒストグラム及び同図(F)の右方向ヒストグラムが
得られる。つまり、右方向による濃度が極端に変化して
いる個所が文字の右端であり、左方向による濃度が極端
に変化する個所が文字の左端である。そして、垂直方向
についても同じように、上方向成分(第4図(H)),
下方向成分(第4図(I))を持つ画像のヒストグラム
により垂直方向についても切出す。この実施例では水平
方向に一列であるので、金額記入欄4の全体について行
なうのみで良い。水平方向に切出されたものの各々につ
いて垂直方向に切出すようにすれば、水平方向に一列で
ないときでも可能である。そして、このようにして切出
された領域の中心点を求め、この点を中心として24×24
画素の領域を文字の切出領域とする。これは、上述した
標準パターンの特徴量が24×24画素として得られている
ため、これに合せるためである。
第5図(C)は濃度勾配の画像であり、同図(D)は
濃度勾配を2値化したものを示している。また、第5図
(E)は左方向ヒストグラムであり、各文字の左端を規
定する左端線100が求められ、同図(F)は右方向ヒス
トグラムであり、各文字の右端を規定する右端線200が
求められ、これら左端線100及び右端線200によって同図
(B)の如く文字の切出しが行なわれる。
次に、上述のようにして切出された各文字について、
特徴量算出部20で特徴量(以下、入力パターン特徴量と
いう)を抽出する。入力パターン特徴量(IPm[i]
[j][k];但し、mは切出し番号,iは水平方向の区
分番号,jは垂直方向の区分番号,kは濃度勾配方向番号)
は標準パターンの特徴量を抽出した方法と同様であり、
切出された文字の画像データにロビンソン・オペレータ
のマスクを利用して画素毎に濃度勾配強度及び濃度勾配
方向を求めて2値化し、更に文字の切出領域を4×4の
16エリア(IPm[i][j])に区分し、各エリア毎に
各濃度勾配方向毎の画素数の総和を求める。こうして求
められる128次元ベクトル量が入力パターン特徴量であ
る。そして、切出された文字の全てについて入力パター
ン特徴量の抽出が終了すると、この入力パターン特徴量
に基づき辞書25を利用して、大分類部21での大分類,中
分類部22での中分類,詳細分類部24での詳細分類の3段
階によってパターン認識を進めていく。
すなわち、最初にクラスターを判別するために大分類
を行なうが、大分類は第18図の大分類辞書のクラスター
毎の各クラスター標準特徴量CSPn[i][j][k]と
の類似度(Distn)を下記(5)式により算出し、最も
類似するもの(Distが最小となるもの)を求め、そのク
ラスターに属する文字と判断する。
なお、上述したように大分類辞書のクラスター内の標
準パターンは、画像入力の際に回転ずれによる変動が生
じた場合の特徴量によりクラスター内に追加登録がなさ
れているので、大分類で失敗することはない。大分類に
よって切出文字の属するクラスターが判断されると、次
に中分類部22で中分類を行なう。中分類は、入力パター
ン特徴量IPm[i][j][k]とクラスターに属する
全ての標準パターンの標準特徴量SPx[i][j]
[k]との類似度(Distx)を上記(5)式により算出
し、所定値以上類似するものであって最も類似する方か
ら(Distxの小さい方から)2つを候補として抽出す
る。
この際、類似するものがないとき(Distxが所定以下
のものがないとき)には標準パターンにない文字と判断
し、数字「0〜9」又は円記号「¥」,「*」等の終桁
符号の文字でないとする。又、類似するものが1つのと
きには、その標準パターンと判断する。通常は2つの候
補が抽出され、この場合には2つの標準パターンが同じ
文字か否かを判断する。例えば同じ文字種の標準パター
ン“a0"の「0」と“f0"の「0」が抽出されたような場
合には最も類似する方の標準パターンとし、文字を
「0」と判断する。これは最終的に文字が「0〜9」,
「¥」,「*」のどれであるかが分れば良いからであ
り、標準パターンは“a0"でも“f0"でもどちらでも良い
からである。又、異なる文字標準パターンが2つ抽出さ
れたときには、詳細分類部24での詳細分類に移行する。
詳細分類は、抽出された2つの候補の標準パターンを
比較し、両パターンの各区分毎の特徴量のうち安定した
非類似なエリアを抽出し、そのエリアについてのみパタ
ーン照合を行なうものである。具体的に第20図のフロー
チャートに従って、第21図の説明図を用いて説明する。
第21図の(A)及び(B)に示すように、中分類で標
準パターンx1及びx2の2つの候補として抽出されたとす
る。そして、抽出された標準パターン間の相違度D
iff[i][j]を各エリア(4×4)毎に下記(6)
式により求める。
この(6)式の意味は、あるエリアにおける2つの候
補文字標準パターン間の特徴量の相違度に、そのエリア
での特徴量の安定度(重み)を掛け合せた式になってお
り、パターンの変動が生じている場合においても2つの
候補文字間の非類似性が高く、かつ安定したエリアを抽
出するための尺度が表現されている。そして、(6)式
におけるWTx[i][j]は辞書作成処理における変動
パターンの追加登録時に求められている。(6)式によ
り各エリア毎の相違度を求めた具体例が第21図(C)で
あり、このようにして求めた各エリア毎の相違度の中か
ら相違度の大きい3つのエリアを抽出する。第21図
(C)の例では、Diff[1][1],Diff[0][1],
Diff[3][0]が抽出され、同図(D)の斜線エリア
が得られる。この3つのエリアは標準パターン同士が非
常に相違している部分であると共に、画像入力の際生じ
る変動による影響の小さい部分であるので、このエリア
についてのみ入力パターンがどちらの標準パターンに類
似しているかを見れば、より正確に判別できる。まず、
抽出された3つのエリアについてのみ、入力パターンの
特徴量と2候補の標準パターンの特徴量の類似度ADistx
[i][j]を次の(7)式により求める。
そして、3つのエリアの相違度の総和をエリア類似度
ADistx[i][j]とする。第21図の例では各エリア類
似度は次の(8)式,(9)式で表わせる。
ADistx1 =Distx1[1][1]+Distx1[0][1]+Distx1[3][0]……(8) ADistx2 =Distx2[1][1]+Distx2[0][1]+Distx2[3][0]……(9) こうして求められた2候補の標準パターン(x1及び
x2)とのエリア類似度ADistx1,ADistx2の類似度を比較
し、より類似する方(ADistの小さい方)を入力パター
ンの文字と判断する。この入力パターンの文字認識動作
は上述の切出された文字の全てについて行ない、その後
認識動作を終了する。
この段階で小切手等の金額記入欄に記入されている金
額情報が認識できる。
なお、上記実施例では大分類時点作成時にクラスター
分析のウォード法を用いているが、これに限定されるも
のではなく、パターン間の一定の類似関係によって分類
できるものであれば何でも良い。又、上記実施例ではク
ラスター特徴量としてクラスター内のパターンの特徴量
の平均を用いているが、平均を用いず、クラスター内の
パターンの1つの特徴量を代表してクラスター特徴量と
しても良く、要するにクラスター内のパターンを代表し
て表現できる特徴量であれば良い。さらに、上記実施例
では特徴量として濃度勾配強度及び濃度勾配方向を採用
しているが、これに限定されるものではなく、パターン
の特徴を表わせることができるものであれば良い。さら
に又、上記実施例では変動パターンを予め作成し、それ
を画像入力することにより変動パターン特徴量を抽出す
るようにしているが、この方法に限定されるものではな
く、例えば、標準パターンを画像入力した際の画像デー
タに回転,ずれ等の画像処理を行なって変動パターンの
画像データを作成して、変動パターン特徴量を抽出する
ようにしても良い。
発明の効果; 以上のように本発明によれば、認識用辞書として変動
パターンを考慮した変動パタン特徴量によってクラスタ
ーを構成しており、大分類から中分類に従って複数候補
を挙げた後に、文字特徴の変動が校了された詳細分類を
している。このため、高速で確実な認識を実現できる。
また、変動パターンを考慮した辞書作成であるが、辞書
としては大分類辞書の文字コードの増加及び詳細分類で
の重みパターンの増加のみにおさえられ、辞書容量の大
きな増大は防ぐことが出来る。
請求項1の発明は、多段階クラスタリングの採用によ
って高速なパターン認識が可能であり、大分類辞書に変
動パターンによって追加登録しているので大分類での失
敗をなくし、認識率の向上を図れる。また、請求項2の
発明は、中分類の段階で類似する標準パターンの候補を
複数上げておき、その候補に上った標準パターン間で非
類似なエリアを抽出し、この部分に基づいて最終的に認
識している。これにより、類似するもの同士の判別であ
っても確実に判別できる。さらに、請求項3の発明は標
準パターンに基づいて分類辞書作成後、予め変動パター
ンによる分類を行なって分類がまちがったクラスターに
追加登録しておく方法を採用したので、更新が非常に容
易であると共に、分類の際には認識率が向上する。
【図面の簡単な説明】
第1図は本発明の認識用辞書の作成方法を示すフローチ
ャート、第2図は手形の一例を示す図、第3図は小切手
の一例を示す図、第4図(A)〜(I)及び第5図はそ
れぞれ具体的な画像例を示す図、第6図は標準パターン
の例を示す図、第7図はスムージング処理例を示すフロ
ーチャート、第8図〜第10図はスムージングを説明する
ための図、第11図は標準特徴量の抽出動作を示すフロー
チャート、第12図〜第14図はその抽出動作を説明するた
めの図、第15図は大分類辞書の例を示す図、第16図は標
準パターンを説明するための図、第17図は中分類辞書の
例を示す図、第16図は標準パターンを説明するための
図、第17図は中分類辞書の作成例を示す図、第18図は中
分類辞書の例を示す図、第19図本発明の認識装置のブロ
ック構成図、第20図は詳細分類の動作例を示すフローチ
ャート、第21図は詳細分類を説明するための図、第22図
及び第23図は従来技術を説明するための図である。 1,4……金額記入欄、2,5……情報欄、3,6……金額情報
欄、10……画像入力部、11……前処理、12……文字抽出
部、20……特徴量算出部、21……大分類部、22……中分
類部、24……詳細分類部。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象文字の標準的なパターンである標
    準パターンを相互の類似関係によって分類構成したもの
    に、画像読取の際に生ずるであろう変動を考慮した変動
    パターンに対応する標準パターンが追加登録されている
    複数のクラスターと、前記複数のクラスターそれぞれに
    属する追加登録された前記変動パターンに対応する標準
    パターン以外の標準パターンから算出された各クラスタ
    ーを代表するクラスター特徴量とで成る大分類辞書と、 前記標準パターンと、前記標準パターンに対応する標準
    特徴量との対応関係が定められている中分類辞書とを備
    え、 読取った被認識パターンの特徴量である入力パターン特
    徴量を抽出し、前記入力パターン特徴量と前記大分類辞
    書に定められているクラスター特徴量とを比較して前記
    被認識パターンが属するクラスターを判別し、前記判別
    されたクラスター内の標準パターンについて、前記中分
    類辞書に定められている前記標準特徴量と前記入力パタ
    ーン特徴量とを比較し、最も類似する標準パターンを認
    識結果として出力するようにしたことを特徴とするパタ
    ーン認識方法。
  2. 【請求項2】認識対象文字の標準的なパターンである標
    準パターンを相互の類似関係によって分類構成したもの
    に、画像読取の際に生ずるであろう変動を考慮した変動
    パターンに対応する標準パターンが追加登録されている
    複数のクラスターと、前記複数のクラスターそれぞれに
    属する追加登録された前記変動パターンに対応する標準
    パターン以外の標準パターンから算出された各クラスタ
    ーを代表するクラスター特徴量とで成る大分類辞書と、 前記標準パターンと、前記標準パターンに対応する標準
    特徴量との対応関係が定められている中分類辞書とを備
    え、 読取った被認識パターンの特徴量である入力パターン特
    徴量を抽出し、前記入力パターン特徴量と前記大分類辞
    書に定められているクラスター特徴量とを比較して前記
    被認識パターンが属するクラスターを判別し、前記判別
    されたクラスター内の標準パターンについて、前記中分
    類辞書に定められている前記標準特徴量と前記入力パタ
    ーン特徴量とを比較し、類似する標準パターンを複数候
    補として抽出し、前記複数候補として抽出された各標準
    パターンをそれぞれ複数のエリアに分割した際に、各エ
    リアを比較して相違度の高いエリアを非類似なエリアと
    して抽出し、前記非類似なエリアについて候補として抽
    出された各標準パターンの標準特徴量と前記入力パター
    ン特徴量とを比較し、最も類似する標準パターンを認識
    結果として出力するようにしたことを特徴とするパター
    ン認識方法。
  3. 【請求項3】認識対象文字の標準的なパターンである標
    準パターンを画像入力して、前記標準パターンの標準特
    徴量を抽出し、前記標準特徴量に基づいて相互の類似関
    係により前記標準パターンを分類構成した複数のクラス
    ターと、前記複数のクラスターのそれぞれに属する前記
    標準パターンの標準特徴量から算出したクラスター特徴
    量とで成る分類辞書を作成した後、前記画像入力に際し
    て生ずるであろう変動を考慮して作成された前記標準パ
    ターンに対する変動パターンの特徴量である変動パター
    ン特徴量を抽出し、前記各クラスター特徴量と前記変動
    パターン特徴量とを比較することによって前記変動パタ
    ーンが前記複数のクラスター中のどのクラスターに属す
    るかを判別し、判別されたクラスター内に前記変動パタ
    ーンに対応する標準パターンが存在していない場合に
    は、そのクラスター内にその標準パターンを追加登録す
    るようにしたことを特徴とするパターン認識用辞書作成
    方法。
JP2198259A 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法 Expired - Fee Related JP2965165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2198259A JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2198259A JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Publications (2)

Publication Number Publication Date
JPH0484287A JPH0484287A (ja) 1992-03-17
JP2965165B2 true JP2965165B2 (ja) 1999-10-18

Family

ID=16388156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2198259A Expired - Fee Related JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Country Status (1)

Country Link
JP (1) JP2965165B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8942420B2 (en) * 2012-10-18 2015-01-27 Qualcomm Incorporated Detecting embossed characters on form factor
JP6217403B2 (ja) * 2014-01-16 2017-10-25 富士通株式会社 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置
CN116912867B (zh) * 2023-09-13 2023-12-29 之江实验室 结合自动标注和召回补全的教材结构提取方法和装置

Also Published As

Publication number Publication date
JPH0484287A (ja) 1992-03-17

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
US5799115A (en) Image filing apparatus and method
KR100248917B1 (ko) 패턴인식장치및방법
US7120318B2 (en) Automatic document reading system for technical drawings
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
US20030198386A1 (en) System and method for identifying and extracting character strings from captured image data
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
Zhou et al. Discrimination of characters by a multi-stage recognition process
US6549662B1 (en) Method of recognizing characters
JP2985893B2 (ja) パターン認識装置
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
US6198846B1 (en) Character recognition system
JP2898562B2 (ja) ナンバープレート決定方法
JP3370934B2 (ja) 光学的文字読み取り方法とその装置
JPH1063789A (ja) 識別関数学習方法
Peng et al. Document image matching based on component blocks
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
Assabie et al. Multifont size-resilient recognition system for Ethiopic script
WO2001026024A1 (fr) Dispositif et procede d'identification de document
JP2000113110A (ja) 光学的文字読み取り装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JPH0656625B2 (ja) 特徴抽出方式

Legal Events

Date Code Title Description
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees