JPH0484287A - パターン認識方法及び認識用辞書作成方法 - Google Patents

パターン認識方法及び認識用辞書作成方法

Info

Publication number
JPH0484287A
JPH0484287A JP2198259A JP19825990A JPH0484287A JP H0484287 A JPH0484287 A JP H0484287A JP 2198259 A JP2198259 A JP 2198259A JP 19825990 A JP19825990 A JP 19825990A JP H0484287 A JPH0484287 A JP H0484287A
Authority
JP
Japan
Prior art keywords
pattern
standard
cluster
feature
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2198259A
Other languages
English (en)
Other versions
JP2965165B2 (ja
Inventor
Shinji Ono
尾野 真司
Yasuo Fujita
藤田 泰生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2198259A priority Critical patent/JP2965165B2/ja
Publication of JPH0484287A publication Critical patent/JPH0484287A/ja
Application granted granted Critical
Publication of JP2965165B2 publication Critical patent/JP2965165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の目的 (産業上の利用分野) 本発明は文字パターンの認識に際して、多段階のクラス
タリングを利用したパターン認識方法及び装置並ひにそ
のパターン認識に用いる認識用辞書の作成方法に関する
(従来の技術) 従来、高速なパターン認識を可能とする認識方式として
、特開平1−1117F+85号公報に示される多段階
のクラスタリングを用いた文字認識方式か存在する。こ
の文字認識方式を第22図を用いて説明する。
認識に用いる辞書は、認識の第1段階て使用する大分類
(Aクラスタ)と第2段階で使用する分類(Bクラスタ
)との2段階で構成されている。
第2段階のBクラスタには各文字の標準特徴量が各文字
毎に記載されており、大分類(Aクラスタ)は、Bクラ
スタの各文字の特徴量が相互に定の類似関係にあるもの
を1つのグループとして、各々複数のグループて構成さ
れている。そして、大分類(Aクラスタ)の各グループ
毎の代表標準特徴量としては、例えはグループ内のJI
Sコートの一番若い文字の特重量か使用されている。こ
のような認識用辞書を用いた文字認識の手順を説明する
と、先ず第1段階として認識すべき被読取文字の特徴量
を検出し、その被読取文字の特t’lJ iと大分類(
Aクラスタ)の各グループ毎の代表標準特徴量とを比較
照合し、最も類似するグループを抽出し、そのグループ
に属する文字のいずれかであると判断する。そして、こ
のグループを判別すると第2段階に移り、当該グループ
内の各文字の標準特徴量と被読取文字の特徴量とを比較
照合し、特徴量の最も類似する文字であると判断し、そ
の結果を認識結果として出力するようになっている。
以上のように、文字認識に際して多段階のクラスタリン
グを行なうことにより、高速な認識を実現している。
(発明が解決しようとする課題) しかしなから、上記従来の文字認識方式では、例えは被
読取媒体か読取りの際に変動(回転すれ等)した場合に
は、読取ったパターンの特徴量は、変動か生していない
場合と比へて多少すれてしまい、大分類のクラスタリン
グの際に、本来抽出するへきグループとは別のグループ
を抽出してしまうことかある。
このような抽出ミスが生するのは、標準パターンの特徴
量が第1段階の分類内のものであっても、代表標準特徴
量に対して比較的類似度の低いパターンの場合である。
第23図を用いて具体的に説明すると、例えば“0”〜
°“9°゛の文字の標準パターンの特徴量に基づいて大
分類を作成し、4つのグループ(No、l〜No、4)
に分けることができたと仮定し、その代表標準パターン
がグループNo、 1では[0」、グループN002で
は「3」、グループNo、3では「8」、グループNo
、4ではrl」になったとする。この場合、例えば7”
はその代表標準パターン“1”の特徴量を代表標準特徴
量とするグループN004内であっても、代表標準時f
f1l量に対して比較的類似度の低い特徴量であるため
、読取りの際に変動(回転、すれ等)が生しると検出し
た特徴量は「7」の標準特徴量に対してずれか生じ、そ
のずれによってグループNo、4外となってしまったり
、又はグループNo、3に属すると判断してしまうこと
がある。同様のことかグループNo、2の「5」、グル
ープNo、3の「9」についても言える。このように、
大分類て分類を失敗してしまうと、第2段階て照合を行
なっても該当するものがなく認識不可能となフてしまい
、結局大分類の分類の失敗か認識率の低下をもたらし問
題となっている。
本発明は上述のような問題に鑑みてなされたものであり
、本発明の目的は、文字パターンの読取りの際に生じる
変動(回転、ずれ等)を予め考慮して作成した2識用辞
書を用いてパターン認識を行ない、認識率の低下をもた
らすことなく、しかも高速でパターン認識を可能とする
パターン認識方法及び装置並びにそのパターン認識に用
いるU識用辞書の作成方法を提供することに競る。
発明の構成。
(課題を解決するための手段) 本発明はパターン認識方法に関するものて、本発明の上
記目的は、認識可能な文字の標準的なパターンである標
準パターンを相互の類似関係によって複数のクラスター
に分類構成すると共に、各クラスター毎にクラスターを
代表するクラスター特徴量か定められた大分類辞書と、
この大分類辞書には画像読取の際に生ずるであろう変動
を予め考慮した変動パターンに基づいて、変動が生じた
際、前記変動パターンが入るクラスターにその対応する
標準パターンが予め追加登録されており、各標準パター
ン毎の特徴量である標準特徴量が定められた中分類辞書
とを備え、読取った被認識パターンの特徴量である入力
パターン特徴量を抽出し、この入力パターン特徴量と前
記大分類辞書に定められた各クラスター特徴量とを比較
して入力パターンが属するクラスターを判別し、この判
別されたクラスター内の標準パターンについて、前記中
分類辞書に定められた標準パターンに対応する標準特徴
量と入力パターン特徴量とを比較し、最も類似する標準
パターンを認識結果として出力するようにすることによ
って達成される。
また、認識可能な文字の標準的なパターンである標準パ
ターンを相互の類似関係によって複数のクラスターに分
類構成すると共に、・各クラスター毎にクラスターを代
表するクラスター特徴量が定められた大分類辞書と、こ
の大分類辞書には画像読取の際に生ずるであろう変動を
予め考慮した変動パターンに基づいて、変動か生じた際
、前記変動パターンが入るクラスターにその対応する標
準パターンが予め追加登録されており、各標準パターン
毎の特徴量である標準特徴量か定められた中分類辞書と
を備え、読取った被認識パターンの特徴量である入力パ
ターン特徴量を抽出し、この入力パターン特徴量と前記
大分類辞書に定められた各クラスター特徴量とを比較し
て入カバターンが属するクラスターを判別し、この判別
されたクラスター内の標準パターンについて、前記中分
類辞書に定められた標準パターンに対応する標準特徴量
と入力パターン特徴量を比較し、類似する標準パターン
を複数候補として抽出し、この候補として抽出された標
準パターン間で非類似なエリアを抽出し、この非類似な
エリアについて候補として抽出された各標準パターンの
標準特徴量と入力パターン特徴量とを比較し、最も類似
する標準パターンを認識結果として出力することによっ
て達成される。さらに、本発明はパターン認識用辞書作
成方法に関するもので、未発明の上記目的は、認識可能
な文字の標準的なパターンである標準パターンを画像入
力して、各標準パターン毎の標準特徴量を抽出し、この
標準時t35!量に基づいて相互の類似関係により複数
のクラスターに分類構成すると共に、各゛クラスター毎
にクラスターを代表するクラスター特徴量を定めて分類
辞書を作成して後、画像入力に際して生ずるであろう変
動を考慮して作成された前記標準パターンに対する変動
パターンの特徴!である変動パターン特徴量を抽出し、
前記各クラスター特′重量と変動パターン特徴量とを比
較することによって前記変動パターンがどのクラスター
に属するかを判別し、判別されたクラスター内に変動パ
ターンに対応する標準パターンか存在していない場合に
は、そのクラスター内にその標準パターンを追加登録す
ることによって達成される。
(作用) 本発明は小切手1手形等にチエツクライタて記入された
数字等を確実に認識するための方法及びその認識に最も
通した認識用辞書の作成方法を提供している。
請求項1の発明では、認識可能な文字の標準パターンを
類似するもの同±1つのグループとしてクラスターを作
成し、しかも各クラスター毎にクラスターを代表するク
ラスター特徴量を定めた大分類辞書と、各標準パターン
及びその特徴量である標準特命量を定めた中分類辞書と
を予め作成しである。そして、これら辞書を用いて大分
類−中分類によって認識する。すなわち、被認識パター
ンの特IS5!量と大分類辞書のクラスター特(軟量と
を比較照合し、被認識パターンがどのクラスターに属す
るかを判別し、大まかな大分類を行なう。そして、大分
類でクラスターか判別されると、クラスター内に属する
標準パターンであって中分類辞書に記憶されたその標準
パターンに対応する標準特徴量と被認識パターンの特徴
量とを比較照合して中分類を行ない、最も類似する標準
パターンをπこ識結果として出力する。このように多段
階て認識を進めて行くため、高速な認識か可能となる。
また、被認識パターンに読取の際に生する回転。
すれ等による変動を考慮した変動パターンについても予
め大分類辞書で分類しておき、変動が生した際にも正し
く認識できるかどうかを確認し、正しく認識できすに誤
ったクラスターと判別したときには変動パターンに対応
する標準パターンを大分類辞書のそのクラスターに追加
登録をしである。従って、被認識パターンの読取りの際
に変動カ生しても大分類で失敗することはない。
請求項2の発明では中分類の段階で最終結果を出力せず
に、類似する複数の候補を挙げておき、この候補に挙が
った標準パターン間で非類似なエリアを抽出し、そのエ
リアで標準パターンの特徴量と被認識パターンの特徴量
とを比較照合するようにして、このエリアて最も類似す
る標準パターンを認識結果として出力する。従って、類
似するパターンのうちとちらのパターンであるかの最終
判断か確実にてきるのて開織の誤りかなく、信頼性の高
い認識か可能となる。
請求項3の発明は、認識に用いる辞書の作成方法に関す
るものである。先ず認識可能な標準パターンに基づいて
その類似性によって複数のクラスターを作成し、そのク
ラスター毎にクラスターを代表するクラスター特miを
定めて分類辞書を作成しておき、その作成後、画像の読
取の際に生ずるであろう変動を考慮して、標準パターン
にその変動を加えた変動パターンを分類辞書に基づいて
予め分類を行なって、正しく分類てきるかどうかを確認
しておき、正しく分類てきずに誤ったクラスターに分類
されたときにはその対応する標準パターンをそのクラス
ターに追加登録しておく。
このような方法を採用することにより、クラスター特徴
量は最初に辞書を作成したときのものをそのまま利用で
き、変動等によって分類を誤った場合にはただ単にクラ
スター内に誤ったパターンに対応する標準パターンを追
加登録するのみて済み、辞書の更新か非常に簡単であり
、しかもこの辞書による分類失敗か減少し認識率が向上
する。
(実施例) 以下に本発明の詳細な説明する。
本実施例は小切手1手形等に記入されている金額を認識
するためのものであり、最終的に認識すべき文字の種類
は数字の「0〜も」及び日記号「¥J、’*J等の終桁
符号の12種類である。第2図は手形の一例を示してお
り、中央部にチエツクライタで金額を記入するための金
額記入欄1か設けられている。また、第3図は小切手の
一例を示しており、中央部にチエツクライタで金額を記
入するための金額記入欄4が設けられている。本発明は
、これら手形又は小切手等の金額記入欄(1,4)にチ
エツクライタで記入される数字1日記号及び「*」等の
終桁符号を認識するものである。
先ず、本発明の認識に用いる認識用辞書について説明す
る。
第1図は認識用辞書の作成動作を示す概略フローてあり
、第1図において、初めに標準パターン毎の標準特徴量
の抽出までの概略を説明すると、標準パターンについて
の画像入力が行なわれ(ステップS1)、前処理として
スムージングが行なわれ(ステップS2)、その後に標
準パターン毎の標準特徴量の抽出が行なわれる(ステッ
プS3)。ここで、標準パターン及びその画像入力。
スムージング処理、標準特徴量の抽出の工程を詳しく説
明する。
標準パターンの種類は第6図に示すようなものであり、
12種の文字に対して文字の形態を考慮して予め220
個のパターンが作成されている。かかる220個のパタ
ーンの各々が標準パターンであり、通常使用されている
文字形態の大部分が含まれている。画像入力はこの予め
作成された所定の大きさの標準パターンを、例えば24
X24画素の矩形範囲で各画素毎に濃度階調を8ビツト
の256階調て読取っている。この入力された画像デー
タの例か第4図(八)であり、この画像データは前処理
としてスムージング処理がなされるか、このスムージン
グ処理を次に説明する。
第7図はス・ムージンーグ処理の動作例を示すフローチ
ャートであり、第8図〜第1O図゛はその説明図である
。スムージング処理は第10図に示す3×3画素のスム
ージングマスクを、入力画像データについて走査するこ
とにより入力画像データの平滑化を行なっている。すな
わち、先ず第8図に示すように入力画像データの各画素
毎の濃度値に基づいて、その濃度値の画素数のヒストグ
ラムを作成しくステップ520)、そのピークとなる濃
度値を背景−濃度値(BP)として算出する(ステップ
521)。
これは、通常文字パターンは文字部分よりも背景部分か
多く、背景部分の濃度値は一定となるため、ピークとな
る濃度値(BP)が背景の濃度値となるからである。そ
して、第9図に示すように背景濃度値を24X24画素
の周囲に1画素配置し、25X26画素の画像データと
する(ステップ522)。
これは、3×3画素のスムージングマスクが24x24
画素内の入力画素データの全てについて作用し得るよう
にするためである。次に、26X26画素の画像データ
に第10図に示すスムージングマスクを走査しくステッ
プ523)、入力画像データの平滑化を行ない、その結
果を以後の画像データとして使用する。この段階の画像
データの例が第4図(B)である。このようにスムージ
ング処理を行なっておくことにより、チエツクライタで
の文字の刻印による模様を文字の濃度値で埋めることに
なり、文字刻印模様を消去することが出来る。
よって、安定な文字特徴が得られる利点がある。
次に、上述のようにしてスムージング処理された画像デ
ータに対して標準特徴量の抽出を行なう(ステップS3
)。この標準特徴量の抽出動作を第11図〜第14図を
参照して説明する。
第11図は標準パターンの標準特徴量の抽出動作を示す
フローチャートであり、先ずスムージング処理された画
像データにロビンソン・オペレータを使用して各画素毎
に濃度勾配強度及び濃度勾配方向を求める(ステップ5
30〜532)。ロビンソン・オペレータを示すのか第
12図てあり、3X3画素の各画素に重みが付けられて
い、る8種類のマスクM。−M7て成っており、各マス
クM。−M7はそのマスクが有する方向の勾配強度を抽
出するためのものである。例えはマスクM。により画像
データを走査すれば、各画素毎に1方向の勾配強度(E
P o)が求められる。このように、8方向のマスクM
o〜M、を用いて画像データを走査することによって、
各画素毎に各方向毎の濃度勾配強度(EPo=EP7)
を求めることができる(ステップ530)。なお、濃度
勾配強度EP、〜EP7はそれぞれマスクM0〜M7に
対応している。このようにして各画素毎に求めた濃度勾
配強度(EP0〜EP7)の中から最大値(EP、)を
求める(ステップ531)。゛そして、最大値(EP、
)をその画素の濃度勾配強度とし、その最大値EP、に
対応する方向を濃度勾配方向とする(ステップ532)
。第4図(C) に、このようにして求めた画像データ
を示す。
次に、このようにして求めた各画素毎のa度勾配強度に
関して2値化処理を行なう(ステップS33,540〜
543)。第13図を参照して、2値化処理のためのし
きい値を決定する方法を説明する。
先ず全ての画素の中から濃度勾配強度の最大値(EPm
aX)を求め(ステップ533)、この最大価(EPm
a、)か所定の範囲にあるとことをチェツクしくステッ
プ540)、それ以外の値かあると画像入力ミスとして
エラー処理をする(ステップ541)。これにより、画
像処理の初期の段階で画像入力ミスを発見できる。そし
て、最大値(EP−8)か所定範囲内であれは、この1
/8のEP□x/8をしきい値(EPTH;以下「有効
レベルしきい値」という)とする(ステップ542)。
そして、各画素の濃度勾配節y (Ept)か有効レベ
ルしき値(EPTH)より太きけれはその画素の濃度勾
配強度を°1″とし、有効レベルしきい値(EPTH)
より小さけれはその画素の濃度勾配強度を°°0゛とす
る(ステップ543)。これにより、各画素の濃度勾配
強度はO°′又は”1”’の2値化か行なわれる。この
2値化された画像データの例か第4図(D)であり、更
にことに濃度勾配方向も合せて表示した例か第4図([
)である。
次に、第14図の(A) に示すようにこの2値化され
た画像データを(ixj)等分し、複数のエリアに区分
する(ステップ544)。ここでは、4X4の16のエ
リア(SP、[il[jl[k] j−0〜3.j〜0
〜3)に区分した場合を示している。但し、iは水平方
向の区分番号、jは垂直方向の区分番号、Xは標準パタ
ーンの番号である。そして、第14図CB)のように各
エリア毎に濃度勾配方向毎の濃度勾配強度の総和(SP
、[il[jl[k]; j−0〜3.」−〇〜3k・
0〜7)を求める(ステップ545)。但し、kは濃度
勾配方向である。このようにして求められた値SP、 
[jl [jl [k]が標準パターンの標準特徴量で
あり、i x j X k (’128)次元のベクト
ル量である。
以上の工程によって標準パターンの標準特徴量か求めら
れる。そして、1つの標準特徴量について所定回数、例
えは同一の10個の標準パターンにより各々特徴量を求
め、その平均値をその標準パターンの正規の標準時m 
量として記憶する(ステップS3)。
第1図において、220個の全ての標準パターンについ
て同様にして標準特徴量(SPx[’l [J] [k
])を求める(ステップ54)。次に、各標準パターン
の標準特徴量SP、 [il [jl [k]に基づい
て大分類辞書を作成する(ステップS5)。大分類辞書
の内容は第15図に示すようになっており、この大分類
辞書は各標準パターンの標準特徴量が一定の類似関係に
あるものを1つの小集団(以下、クラスターとする)と
して、複数のクラスターから構成されている。具体的に
は標準特徴量に基づいて一般に知られているクラスター
分析法、例えはつオート法でクラスターを作成する。す
なわち、標準パターンの標準特徴量間の類似度を示すシ
ティ−ブロック距[(Di□)を全ての標準パターンの
川合せについて、次の(1)式により求める。
Dust(X+X2) ・・・・・・・・・(1) (但し、xi、x2は標準パターン番号)そして、全て
の組合せについてシティブロック距離を算出した結果、
距離が最も小さいもの同士を1つのクラスターとし、そ
のクラスターに属する標準パターンの標準特徴量の平均
値を・そのクラスターの特徴量とする。次に、再度クラ
スター及びその他の標準パターンとの全ての組合せにつ
いて特徴量のシティ−ブロック距離を算出し、距離の最
も小さいものを1つのクラスターとする。以下、同し動
作をシティブロック距離が所定値以下、例えは100以
下になるまで、又はクラスターの数か所定数、例えは5
0個になるまで繰返す。このように、ウォード法により
標準パターンの標準特徴量の類似度によりクラスター分
けされたものか大分類辞書である。
更に各クラスター毎に特徴量が定められる。これをクラ
スター特徴lという。クラスター特徴量(C5Po[i
l [jl [kl ;但し、nはクラスタ一番号)は
、各クラスターに属する標準パターンの標準特徴量の平
均である。後述するように、実際の認識の際にはこのク
ラスター特重量に基づいて大分類か行なわれるのであり
、このクラスター毎mRとクラスターとの対応関係が大
分類辞書である。なお、この段階の大分類辞書の例が第
15図に示すものである。これに対し、中分類辞書は各
標準パターンとその標準特徴量との対応関係を示すもの
である。第15図の1つについて説明しておくと、例え
はクラスター[14〕てはこのクラスターに属する標準
パターンはb3の’3. 、b5の「5」てあり、又、
このクラスターのクラスター特徴量C3PI4 [+]
 [J] [klはb3の標準特徴量5Pbs ti]
[jl[klとb5の標準特徴量SR,,ti]tj]
[klの平均値となっている。
次に、第15図の大分類基本辞書に変動パターンの追加
登録をする動作について、第1図のステップ510以下
で説明する。変動パターンは、認識用辞書か実際に使用
される認識装置の被認識媒体(文字パターン)の読取精
度に応して決められている。具体的には、認識装置て被
認識媒体の読取精度か回転!て±4度、ずれ量では±1
画素(0,25m、+n)であったとすると、その変動
パターンは例えは回転の場合のものとして一4度、−3
度。
−2度、−1度 +1度、+2度、+3度、+4度、ず
れの場合で一1画素、+1画素の10種類の変動パター
ンか標準パターン(220個)に対して各々作成する。
その例を、文字“0”について第16図に示す。すなわ
ち、第16図(A)の標準パターンに対して、変動パタ
ーンは同図(B)の如く示される。又、この実施例では
回転とずれとを別々にして変動パターンを作成している
が、回転−4度°゛でずれ“”−1画素°°のように回
転とずれを組合せた変動パターンを加えておくこともで
きる。
操作部により、画像入力される変動パターンに対応する
標準パターンのパターン信号を入力し、その変動パター
ンを画像入力する(ステップ510)。入力された画像
データには標準パターンを入力したときと同様にスムー
ジング処理を行ない(ステップ511)、その後に変動
パターン特徴量(vp、[il [jl [kl)ヲ求
メ(ステップ512)、コノ特徴量に基づいて大分類辞
書により大分類の分類を行なう。大分類は、大分類辞書
の各クラスターのクラスター標準特徴量(C5Po[i
l [jl [kl) と変動パターン特徴量(VP、
 [jl [jl [kl )との類似度(D+−tn
)を下記(2)式により算出しくステップ513)、最
も類似度の高い(Dist、か最小となる)クラスター
に属すると判断する(ステップ514)。
D+stn ・・・・・・・・・(2) ただし、nはクラスタ一番号である。
そして、判断されたクラスター内にその変動パターンに
対応する標準パターンが既に登録されているかどうかを
チエツクしくステップ515)、登録されていなければ
、そのパターンをそのクラスター内に追加登録する(ス
テップ515,517)。登録は標準パターンに対応す
るパターン番号のみで、既に登録されてあれは次の変動
パターンについて上記動作を行なう。上述のような変動
パターンの追加登録動作は、標準パターン(220個)
に対応する変動パターンの全てについて行ない、全て終
れは終了となる。なお、変動パターンの追加登録の際に
は標準パターンのパターン番号をクラスター内に追加登
録するのみで、大分類に使用するクラスター特徴量につ
いては更新しない。これは、既存の220個とは別の新
規の標準パターン追加時に、再度全標準パターン内での
大分類の必要性かなくなる上、クラスター特徴■の鈍化
を助き、クラスター内のクラスター特徴量の類似性の差
の拡大を行なうためである。
次に、上記変動パターンの追加登録の際には、後述する
詳細分類で使用するパターン毎の各エリア毎の重みを算
出しているか(ステップ518S18八、519) 、
これについて説明する。これは画像入力の際に変動が生
じた場合であっても、とのエリアか変動による影響か少
ないかを予め調へておくためである。この算出動作を第
17図に従って説明する。
大分類辞書の作成時に処理された標準パターン番号Xの
入力文字のn個の変動パターン特(数量(VP、 、 
p[il [jl [k]) (P  文字変動パター
ン番号1〜n)に対し、4×4のメツシュエリア(i、
、i)毎の平均特徴量°π、 [il [jl [k]
及びそのエリア毎の特徴!分散Ox’ [+] [」]
を次の(3)及び(4)式により算出し、エリア毎の特
徴量分散Oつ’ [il [jlの逆数を重みWT−[
il [jl  として記憶しておく。全変動パターン
について特徴量の算出か終了すると、算出された変動パ
ターン特徴量VPう[] fj] rklのメツシュエ
リア(i、j) @の平均特徴量て及び特徴量分散08
′を下記(3)及び(4)に従って算出する(ステップ
550)。そして、特徴量分散CX2の逆数を重みWT
、 ri ] [j] としくステップ551)、重み
辞書登録する(ステップ552)。この重みWT、 [
il [jlの大きいエリアか、画像入力の際に変動か
生してもその影響の少ない安定したエリアである。
o 、’ [il [jl 第18図か変動パターンを追加登録したこの段階の大分
類辞書の例であり、第15図の大分類辞書と比較すると
、例えはクラスターNo、14では°’e3e5 、 
b8 、o8″の4個の標準パターン番号か追加登録さ
れているのが分る。なお、第18図に示す大分類辞書が
実際のパターンg識の際に使用されるものである。ここ
で、大分類辞書とは類似する文字集団であるクラスター
と、そのクラスターかもつクラスター特徴量との対応関
係を示すものであり、大分類辞書に基づく大分類とは被
認識文字の特徴量とクラスター特徴量とを比較し、被認
識文字がどのクラスターに属する文字であるかを判別す
る処理である。
次に、上記認識用辞書を用いた場合の文字パターン認識
動作について第19図の機能ブロック図に基づいて説明
する。
先ず画像入力部10の画像センサて、例えは第3図に示
す小切手の金額記入欄4の画像を入力する。この金額記
入欄4は予め定められた位置であり、この欄内の濃淡濃
度を256階調で画像センサにより取得する。第5図(
A)か金額記入欄4の原画を示している。このように取
得された画像ブタを前処理部11てスムージングして平
滑化を行なう。この結果第5図(B)のようになり、ス
ムージング処理された画像データに基つき文字切出部1
2は文字の切出しを行なう。文字の切出しは上述したロ
ヒンソン・オペレータにより画像データを走査し、水平
方向については左一方向成分(第4図(F))及び右方
向成分(第4図(F))を持つ画素のヒストグラムによ
り切出しi+=を抽出する。その結果、第5図(E)の
左方向ヒストグラム及び同図CF)の右方向ヒストグラ
ムか得られる。つまり、右方向による濃度か極端に変化
している個所か文字の右端てあり、左方向による濃度か
極端に変化する個所か文字の左端である。そして、垂直
方向についても同しように、上方向成分(第4図(H)
 ) 、下方向成分(第4図(I))を持つ画像のヒス
トグラムにより垂直方向についても切出す。
この実施例では水平方向に一列であるので、金額記入欄
4の全体について行なうのみで良い。水平方向に切出さ
れたものの各々について垂直方向に切出すようにすれは
、水平方向に一列でないときても可能である。そして、
このようにして切出された領域の中心点を求め、この点
を中心として24x24画素の領域を文字の切出領域と
する。これは、上述した標準パターンの特徴量が24X
24画素として得られているため、これに合せるためで
ある。
第5図(C)は濃度勾配の画像であり、同図(D)は濃
度勾配を2値化したものを示している。また、第5図(
E)は左方向ピストグラムてあり、各文字の左端を規定
する左端線100か求められ、同図(F)は右方向ヒス
トグラムであり、各文字の右端を規定する右端線200
か求められ、これら左端線100及び右端線200によ
って同図(B)の如く文字の切出しか行なわれる。
次に、上述のようにして切出された各文字について、特
徴量算出部20で特ff1l量(以下、人カバターン特
徴!という)を抽出する。入カバターン特復量(IPf
fl[il [j] [k] :但し、mは切出し番号
、iは水平方向の区分番号、jは垂直方向の区分番号、
には濃度勾配方向番号)は標準パターンの特徴量を抽出
した方法と同様であり、切出された文字の画像データに
ロビンソン・オペレータのマスクを利用して画素毎に濃
度勾配強度及び濃度勾配方向を求めて2値化し、更に文
字の切出領域を4×4の16エリア(IPIll[il
 [j])に区分し、各エリア毎に各濃度勾配方向毎の
画素数の総和を求める。こうして求められる128次元
ベクトル量か入力パターン特徴量である。そして、切出
された文字の全てについて入力パターン特徴量の抽出か
終了すると、この入力パターン特徴量に基つき辞書25
を利用して、大分類部21ての大分類、中分類部22て
の中分類、詳細分類部24ての詳細分類の3段階によっ
てパターン認識を進めていく。
すなわち、最初にクラスターを判別するために大分類を
行なうか、大分類は第18図の大分類辞書のクラスター
毎の各クラスター標準特徴量cspn[l] [j] 
[k] との類似度(Di、t、)を下記(5)式によ
り算出し、最も類似するもの(Dustが最小となるも
の)を求め、そのクラスターに属する文字と判断する。
1Stn なお、上述したように大分類辞書のクラスター内の標準
パターンは、画像入力の際に回転ずれによる変動か生じ
た場合の特徴量によりクラスター内に追加登録かなされ
ているので、大分類て失敗することはない。大分類によ
って切出文字の属するクラスターか判断されると、次に
中分類部22で中分類を行なう。中分類は、入力パター
ン特徴量IPm[il [j] [k]とクラスターに
属する全ての標準パターンの標準特徴量SP、 H] 
[j] [k]との類似度(Djst、)を上記(5)
式により算出し、所定値以上類似するものであって最も
類似する方から(Distxの小さい方から)2つを候
補として抽出する。
この際、類似するものかないとき(D、□8が所定曖 以下のものがないとき)には標準パターンにない文字と
判断し、数字「0〜9」又は日記号「¥J、’*J等の
終桁符号の文字てないとする。又、類似するものか1つ
のときには、その標準パターンと判断する。通常は2つ
の候補か抽出され、この場合には2つの標準パターンか
同し文字か否かを判断する。例えは同し文字種の標準パ
ターン゛’aO°゛の「0」と°’fo°゛の「O」が
抽出されたような場合には最も類似する方の標準バ々−
ンとし、文字を「0」と判断する。これは最終的に文字
が「0〜9」、「¥J、「*Jのとれであるかが分れは
良いからであり、標準パターンはaOo”でも“fOパ
でもどちらでも良いからである。又、異なる文字標準パ
ターンか2つ抽出されたときには、詳細分類部24ての
詳細分類に移行する。
詳細分類は、抽出された2つの候補の標準パターンを比
較し、両パターンの各区分毎の特徴量のうち安定した非
類似なエリアを抽出し、そのエリアについてのみパター
ン照合を行なうものである。具体的に第2D図のフロー
チャートに従って、第21図の説明図を用いて説明する
第21図の(A)及び(8) に示すように、中分類で
標準パターン×1及びx2の2つの候補として抽出され
たとする。そして、抽出された標準パターン間の相違度
D+rr[i] [j]を各エリア(4X4)毎に下記
(6)式により求める。
1rf =に、に(SP、l[i] [j] [k] −5PX
2 [i] [j] [k]ビX(WTX+[司[j]
  + WT、2 [i] [j])  ・・・・−(
6)この(6)式の意味は、あるエリアにおける2つの
候補文字標準バタ ン間の特徴量の相違度に、 そのエリアでの特徴量の安定度(重み)を掛は合せた式
になっており、パターンの変動か生している場合におい
ても2つの候補文字間の非類似性か高く、かつ安定した
エリアを抽出するための尺度か表現されている。そして
、(6)式におりるWT、、[i] [j] は辞書作
成処理における変動パターンの追加登録時に求められて
いる。 (6)式により各エリア毎の相違度を求めた具
体例か第21図(C) であり、このようにして求めた
各エリア毎の相違度の中から相違度の大きい3つのエリ
アを抽出する。第2】図(C)の例では、Dtrf[]
] [1]D1□[0コ[月、D、 rt [3] [
0]か抽出され、同図(D)の斜線エリアか得られる。
この3つのエリアは標準パターン同士か非常に相違して
いる部分であると共に、画像入力の際生じる変動による
提響の/JXさい部分であるのて、このエリアについて
のみ入カバターンかどちらの標準パターンに類似してい
るかを見れは、より正確に判別できる。ます、抽出され
た3つのエリアについてのみ、人カバターンの特徴量と
2候補の標準パターンの特徴量の類似度ADiStxr
i][jコを次の(7)式により求める。
そして、3つのエリアの相違度の総和をエリア類似度へ
D1stx[!] c、r]とする。第21図の例では
各エリア類似度は次の(8)式、(9)式で表わせる。
八D −D;stx+Il]  []]+ D+stx+[O
コ [1]”  Distx+  [3コ [0]・・
・・・・(8) ^D −D+5txz[Iコ []〕・ D1stxzrD]
  [1〕+ J5tx2[3]  to]・・・・・
・(9) こうして求められた2候補の標準パターン(X+及び×
2)とのエリア類似度AD、□。l+八へ]1StX2
の類似度を比較し、より類似する方(八〇1stの小さ
い方)を人カバターンの文字と判断する。この人カバタ
ーンの文字認識動作は上述の切出された文字の全てにつ
いて行ない、その後認識動作を終了する。
この段階で小切手等の金額記入欄に記入されている金額
情報が認識できる。
なお、上記実施例では大分類時点作成時にクラスター分
析のウォート法を用いているか、これに限定されるもの
ではなく、パターン間の一定の類似関係によって分類で
きるものてあれば何ても良い。又、上記実施例てはクラ
スター特徴量としてクラスター内のパターンの特徴量の
平均を用いているか、平均を用いす、クラスター内のパ
ターンの1つの特徴量を代表してクラスター特徴量とし
ても良く、要するにクラスター内のパターンを代表して
表現てきる特徴!てあれは良い。さらに、上記実施例で
は特徴量として濃度勾配強度及び濃度勾配方向を採用し
ているか、これに限定されるものではなく、パターンの
特徴を表わせることかてきるものてあれば良い。ざらに
又、上記実施例では変動パターンを予め作成し、それを
画像入力することにより変動パターン特徴量を抽出する
ようにしているが、この方法に限定されるものではなく
、例えば、標準パターンを画像入力した際の画像データ
に回転、ずれ等の画像処理を行なって変動パターンの画
像データを作成して、変動パターン特徴量を抽出するよ
うにしても良い。
発明の効果。
以上のように本発明によれは、認識用辞書として変動パ
ターンを考慮した変動バタン特徴量によってクラスター
を構成しており、大分類から中分類に従って複数候補を
挙げた後に、文字特徴の変動が校了された詳細分類をし
ている。このため、高速で確実な認識を実現てきる。ま
た、変動パターンを考慮した辞書作成であるが、辞書と
しては大分類辞書の文字コートの増加及び詳細分類での
重みパターンの増加のみにおさえられ、辞書容量の大き
な増大は防くことか出来る。
請求項1の発明は、多段階クラスタリングの採用によっ
て高速なパターン認識が可能であり、大分類辞書に変動
パターンによって追加登録しているのて大分類での失敗
をなくし、認識率の向上を図れる。また、請求項2の発
明は、中分類の段階で類似する標準パターンの候補を複
数上げておき、その候補に上った標準パターン間て非類
似なエリアを抽出し、この部分に基づいて最終的に認識
している。これにより、類似するもの同士の判別であっ
ても確実に判別できる。さらに、請求項3の発明は標準
パターンに基づいて分類辞書作成後、予め変動パターン
による分類を行なって分類かまちがったクチスターに追
加登録しておく方法を採用したので、更新が非常に容易
であると共に、分類の際には認識率が向上する。
【図面の簡単な説明】
第1図は本発明の認識用辞書の作成方法を示すフローチ
ャート、第2図は手形の一例を示す図、第3図は小切手
の一例を示す図、第4図(八)〜(+)及び第5図はそ
れぞれ具体的な画像例を示す図、第6図は標準パターン
の例を示す図、第7図はスムージング処理例を示すフロ
ーチャート、第8図〜第1θ図はスムージングを説明す
るための図、第11図は標準特徴量の抽出動作を示すフ
ローチャート、第12図〜第14図はその抽出動作を説
明するための図、第15図は大分類辞書の例を示す図、
第16図は標準パターンを説明するための図、第17図
は中分類辞書の例を示す図、第16図は標準パターンを
説明するための図、第17図は中分類辞書の作成例を示
す図、第18図は中分類辞書の例を示す図、第19図本
発明の認識装置のブロック構成図、第20図は詳細分類
の動作例を示すフローチャート、第21図は詳細分類を
説明するための図、第22図及び第23図は従来技術を
説明するための図である。 1.4・・・金額記入欄、2.5・・・情報欄、3.6
・・・金額情報欄、10・・・画像入力部、11・・・
前処理、12・・・文字抽出部、20・・・特徴量算出
部、21・・・大分類部、22・・・中分類部、24・
・・詳細分類部。 114区(A) 出願人代理人   安 形 雄 三 第d邑(8) Y4間 (し) 第 孕 図 (C) 第 図 (F) 第 図 (G) 茶 ブ1 図 第 図 (A) 第 図 必 図 c     S    ヱ 79   百 7゜     8゜  、。            
                         
     −′Dゝ  0″”           
                         
             −二?二!    、。 
ε。− 〇−〜  0ψトののに4       (Q    
       c2     %%         
  毒   葬夏?ニツ μ′8′!!瓢管魚七   
   t      亡  百7?名2”Hot;巴2
;以 7℃壮蓄9I さ 1客 忠      雲  
二=り11曵ユ  ?−−〜   メ − Φ    
 畳 ユ客霊;22ヱ229二で’:S  m x w−コ−
= 宕cg9!7.%Qg(4%9二QQ?、  ’!
=””%2”!  ’!0−N+1’1t+l’114
)N+!1ff1%費0NIQ?LOのcn o 警g
 七t6 零o ;21昔cg F、 729 tz 
tg z y 2 g K −; 2 S S R00
cle+C+Cl0c10c+0OJ)41)jljl
jlAjll)01〜0ψCわ00ψΦn吟n−〜〜〜
的−−財 へ一つ11111111よよよよ本よ状本ま
りよよ本妹 &菰本1ffibffiffi7ffi2
墜i72!ilニアi!ilニア?77772i7+3
度面回 転1画素 一3/f回転 −4度回転 0   )I                   
                         
                         
              ψ nOo      
  ψ の   −−〇−5客 q  >      
                         
     $11−    (α          
               \’j! ’x T−
’!: y首−零 嘆台O−〜 ?Qψト約Φ)井  
  の g−y  ooxetsica+

Claims (1)

  1. 【特許請求の範囲】 1、認識可能な文字の標準的なパターンである標準パタ
    ーンを相互の類似関係によつて複数のクラスターに分類
    構成すると共に、各クラスター毎にクラスターを代表す
    るクラスター特徴量が定められた大分類辞書と、この大
    分類辞書には画像読取の際に生ずるであろう変動を予め
    考慮した変動パターンに基づいて、変動が生じた際、前
    記変動パターンが入るクラスターにその対応する標準パ
    ターンが予め追加登録されており、各標準パターン毎の
    特徴量である標準特徴量が定められた中分類辞書とを備
    え、読取った被認識パターンの特徴量である入力パター
    ン特徴量を抽出し、この入力パターン特徴量と前記大分
    類辞書に定められた各クラスター特徴量とを比較して入
    力パターンが属するクラスターを判別し、この判別され
    たクラスター内の標準パターンについて、前記中分類辞
    書に定められた標準パターンに対応する標準特徴量と入
    力パターン特徴量とを比較し、最も類似する標準パター
    ンを認識結果として出力するようにしたことを特徴とす
    るパターン認識方法。 2、認識可能な文字の標準的なパターンである標準パタ
    ーンを相互の類似関係によって複数のクラスターに分類
    構成すると共に、各クラスター毎にクラスターを代表す
    るクラスター特徴量が定められた大分類辞書と、この大
    分類辞書には画像読取の際に生ずるであろう変動を予め
    考慮した変動パターンに基づいて、変動が生じた際、前
    記変動パターンが入るクラスターにその対応する標準パ
    ターンが予め追加登録されており、各標準パターン毎の
    特徴量である標準特徴量が定められた中分類辞書とを備
    え、読取った被認識パターンの特徴量である入力パター
    ン特徴量を抽出し、この入力パターン特徴量と前記大分
    類辞書に定められた各クラスター特徴量とを比較して入
    力パターンが属するクラスターを判別し、この判別され
    たクラスター内の標準パターンについて、前記中分類辞
    書に定められた標準パターンに対応する標準特徴量と入
    力パターン特徴量を比較し、類似する標準パターンを複
    数候補として抽出し、この候補として抽出された標準パ
    ターン間で非類似なエリアを抽出し、この非類似なエリ
    アについて候補として抽出された各標準パターンの標準
    特徴量と入力パターン特徴量とを比較し、最も類似する
    標準パターンを認識結果として出力することを特徴とす
    るパターン認識方法。 3 認識可能な文字の標準的なパターンである標準パタ
    ーンを画像入力して、各標準パターン毎の標準特徴量を
    抽出し、この標準特徴量に基づいて相互の類似関係によ
    り複数のクラスターに分類構成すると共に、各クラスタ
    ー毎にクラスターを代表するクラスター特徴量を定めて
    分類辞書を作成して後、画像入力に際して生ずるであろ
    う変動を考慮して作成された前記標準パターンに対する
    変動パターンの特徴量である変動パターン特徴量を抽出
    し、前記各クラスター特徴量と変動パターン特徴量とを
    比較することによって前記変動パターンがどのクラスタ
    ーに属するかを判別し、判別されたクラスター内に変動
    パターンに対応する標準パターンが存在していない場合
    には、そのクラスター内にその標準パターンを追加登録
    するようにしたことを特徴とするパターン認識用辞書作
    成方法。
JP2198259A 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法 Expired - Fee Related JP2965165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2198259A JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2198259A JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Publications (2)

Publication Number Publication Date
JPH0484287A true JPH0484287A (ja) 1992-03-17
JP2965165B2 JP2965165B2 (ja) 1999-10-18

Family

ID=16388156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2198259A Expired - Fee Related JP2965165B2 (ja) 1990-07-26 1990-07-26 パターン認識方法及び認識用辞書作成方法

Country Status (1)

Country Link
JP (1) JP2965165B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015135580A (ja) * 2014-01-16 2015-07-27 富士通株式会社 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置
JP2016502169A (ja) * 2012-10-18 2016-01-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated フォームファクタ上の浮き彫りにされた文字の検出
CN116912867A (zh) * 2023-09-13 2023-10-20 之江实验室 结合自动标注和召回补全的教材结构提取方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502169A (ja) * 2012-10-18 2016-01-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated フォームファクタ上の浮き彫りにされた文字の検出
JP2015135580A (ja) * 2014-01-16 2015-07-27 富士通株式会社 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置
CN116912867A (zh) * 2023-09-13 2023-10-20 之江实验室 结合自动标注和召回补全的教材结构提取方法和装置
CN116912867B (zh) * 2023-09-13 2023-12-29 之江实验室 结合自动标注和召回补全的教材结构提取方法和装置

Also Published As

Publication number Publication date
JP2965165B2 (ja) 1999-10-18

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
US6021220A (en) System and method for pattern recognition
EP2943911B1 (en) Process of handwriting recognition and related apparatus
US5267332A (en) Image recognition system
KR100249055B1 (ko) 문자인식장치및방법
US20090041361A1 (en) Character recognition apparatus, character recognition method, and computer product
US20040078755A1 (en) System and method for processing forms
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0420226B2 (ja)
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
JPH0484287A (ja) パターン認識方法及び認識用辞書作成方法
CN111612045A (zh) 一种获取目标检测数据集的通用方法
JPH04111085A (ja) パターン認識装置
JPH11328309A (ja) 光学的文字読み取り方法とその装置
JP2000331122A (ja) 文字認識方法および装置
KR102007791B1 (ko) 단계별 윤곽선 특성 분석을 이용한 숫자 인식 방법 및 장치
Suters et al. Connected handwritten digit separation using external boundary curvature
Slavin et al. Matching Digital Copies of Documents Based on OCR
JP2002024765A (ja) 文字認識装置及び文字認識方法
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム
CN116343232A (zh) 一种基于预分类的古籍数学符号识别方法
WO2019021264A1 (en) SYSTEM AND METHOD FOR DIGITAL FOOTPRINT CLASSIFICATION
Sadri et al. Statistical characteristics of slant angles in handwritten numeral strings and effects of slant correction on segmentation

Legal Events

Date Code Title Description
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees