JPH03192487A - パターン認識方法 - Google Patents

パターン認識方法

Info

Publication number
JPH03192487A
JPH03192487A JP1331254A JP33125489A JPH03192487A JP H03192487 A JPH03192487 A JP H03192487A JP 1331254 A JP1331254 A JP 1331254A JP 33125489 A JP33125489 A JP 33125489A JP H03192487 A JPH03192487 A JP H03192487A
Authority
JP
Japan
Prior art keywords
pattern
probability
similarity
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1331254A
Other languages
English (en)
Inventor
Hiroichi Higuchi
博一 檜口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1331254A priority Critical patent/JPH03192487A/ja
Publication of JPH03192487A publication Critical patent/JPH03192487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明はパターン認識方法、特に原稿等に付与された文
字等のパターンなCCD等で読み取り、標準パターンと
比較して認識するパターン認識方法に関するものである
[従来の技術] 従来、パターン認識においては、辞書の数種類の標準パ
ターンと対象パターンとを比較し、一致する画素数が最
も多くかつ設定値(そのパターンであるとするのに最低
必要な数)より大きい時、対象パターンをその標準パタ
ーンで表わされるパターンであると決定していた。
[発明が解決しようとしている課題] しかしながら、上記従来例にあっては、認識対象のパタ
ーンの種類(文字においてはフォントの種類)を増やそ
うとした時、同じパターンであっても標準パターンを複
数持たなければならないという欠点があった。更に、標
準パターンが増えることにより比較処理回数が増え、認
識が遅くなるという欠点もあった。
本発明は、前記従来の欠点を除去し、少ない認識辞書で
迅速にパターンを認識するパターン認識方法を提供する
[課題を解決するための手段] この課題を解決するために、本発明のパターン認識方法
は、入力されたパターンを標準パターンと比較してパタ
ーンを同定するパターン認識方法であって、 同一パターンに対応する複数種類の標準パターンに基づ
いて、予め各画素について類似確率を求め、れた前記パ
ターンの各画素に対応して前記類似確率を累積すること
により類似度を求める。
[実施例コ 以下添付図面に従って、本発明の実施例を詳細に説明す
る。
〈パターン認識の原理〉 まず、本実施例のパターン認識の原理を説明する。尚本
実施例では、入カバターンは2値化処理により黒(1)
と白(0)とに変換したものに基づいて説明する。
第5図(A)〜(C)は数字“5”の20X20画素の
3つの標準パターンを表わし、第6図は第5図(A)〜
(C)の3つの標準パターンより求められる20X20
の各画素の黒である確率である。すなわち、本例では°
゛5”には3つのパターンを想定しているので、各パタ
ーンの黒の部分を局として加算することにより、第6図
のような確率パターンが得られる。従って、同じ文字の
標準パターンがn個ある場合は、各パターンの黒の部分
を1 / nとして加算することとなる。図中、空白は
0′°を示す。一方、白である確率は第7図のように“
1゛°から黒である確率を引けば求められろ。
一例として、第6図、第7図の20X20の各画素の確
率パターンを辞書とし、例えば第8図の20X20画素
の対象文字パターンとの類似度を求める場合を説明する
まず、類似度をOとしておき、第8図において座標(x
、y)= (0,O)の画素が白であるため、第7図を
参照して類似度に°゛l”を加算する。次に座標(1,
O)においても白であるため、第7図を参照し類似度に
“0パを加算する。
同様に、座標(2,0)(3,0)(4,O)では白で
あるため第7図を参照して°°O°°を加算する。座標
(5,O)では黒であるため第6図を参照して°1”を
加算する。
以下、同様に座標(19,19)まで画素が白ならば第
7図より、黒ならば第6図より確率を求めて順次加算し
ていく。以上の操作で第8図の文字パターンと複数の標
準パターンとの類似度を得る。
実際には確率パターンは複数であるので、たとえば数字
の°°0”°〜” 9 ”であれば、10個の確率パタ
ーン夫々について類似度を求め、類似度の最大である文
字を認識文字とする。
くパターン認識装置の構成例〉 第1図は本実施例のパターン認識方法を実゛現するパタ
ーン認識装置の一例である文字認識装置の構成を示すブ
ロック図である。
1は演算、制御用のcpu、2はCPUIの制御プログ
ラムを格納するROM、3は補助記憶用のRAMであり
、計算される類似度を記憶する類似度記憶部3aと候補
文字とするか否かの判定のためのしきい値を記憶するし
きい値記憶部3bと画素毎の比較のためのカウンタ3C
及び3d(以下カウンタi、j)とを有する。4は文字
認識のために比較するパターンを格納する認識辞書であ
り、本実施例では従来の標準パターンから作成された確
率パターンを格納する確率パターン格納部4aを有する
。又、確率パターンを本装置で作成する場合には、−時
的に標準パターンを格納する標準パターン格納部4bを
有することもある。
5は入力インクフェースで、スキャナ6等からの入カバ
ターンの入力を制御する。7は入出力インタフェースで
、CRT8あるいはプリンタ9への出力及び認識を終了
した入力文書を格納する文書格納部lOとの入出力を制
御する。
第2図は第1図の文字認識装置の基本動作手順を示した
フローチャートである。
まず、ステップS21でスキャナ6等より入力原稿を読
み込み、パターンの切り出し、正規化等の前処理を行う
。ステップS22で確率パターン格納部4aより1つの
確率パターンを読み出し、ステップS23で以下に詳細
を述べる類似度の計算を行う。次に、ステップS24で
算出された類似度と所定のしきい値Tとを比較し、類似
度が大きければ、ステップS25でこの確率パターンを
持つ文字を人カバターンの候補文字とする。
類似度がしきい値T以下ならば、何もせずステップS2
6で全文字の確率パターンとの類似度計算が終了したか
をチエツクし、終了していない場合は、ステップS22
に戻って次の確率パターンについてステップS22〜S
26を繰り返す。
全文字のチエツクが終了すると、ステップS27で候補
文字を出力する。この出力処理において、更に複数の候
補文字から類似度の差や値の大きさ等により候補文字を
絞る等の処理も行なわれる。
第3図は第2図のステップS23の類似度の計算を更に
詳細に示すフローチャートである。
まず、ステップS31で類似度及びカウンタjをOとす
る。ステップS32でカウンタiをOとする。ステップ
S33で画素PIJが白か黒かを判断し、白の場合はス
テップS34で今迄の類似度に、確率パターンのPIJ
が白の確率を加えて新しい類似度とし、黒の場合はステ
ップS35でPIJが黒の確率を加えて新しい類似度と
する。
これを本例では20X20画素、従って、i、j=1〜
20の間で順に加算することにより類似度が算出される
第4図は標準パターンより確率パターンを求める手順を
示すフローチャートである。
まず、ステップS41で全画素の黒の確率パターンQI
J及び白の確率パターンRIJをOとする。ステップS
42で標準パターンの1つを標準パターン格納部4bか
ら読み出す。ステップS43でj=0.ステップS44
でi=oとし、ステップS45で対称画素が1 (黒)
かO(白)かをチエツクし、標準パターン数がnの場合
、1”ならばQ z= Q IJ + 1 / nとし
、”○”ならばRz−RIJ+ 1 /nとする。
これを本例では、20x20画素分作成し、標準パター
ンを他に有する場合は、ステップS52から342に戻
ってこの処理を繰り返す。
所定文字の全標準パターンについて加算が終了すると、
ステップS’53で作成された確率パターンを確率パタ
ーン格納部4aに格納する。
尚、本実施例では第6図、第7図において、辞書の画素
が黒である確率と白である確率とを画素位置に対応させ
て示したが、前述したように画素が白である確率は1か
ら画素が黒である確率を引いたものであるので(逆も又
真)、辞書としてはどちらか一方を記憶しておけばよい
。処理を高速にする為には、両方を記憶しておいた方が
よい。更に、本実施例においては2値化された白と黒の
画像について処理したが、カラー画像等にも適用できる
のは自明である。
以上説明したように、同一文字の複数の標準パターンよ
り、画素が白あるいは黒である確率を求め、認識対象文
字の各々の画素について、その確率を累積する事により
類似度を求める文字認識法により、フォントを増やした
時でも辞書を増やさずに済むという効果がある。又、認
識時間も短くなる。
[発明の効果] 本発明により、少ない認識辞書で迅速にパターンを認識
するパターン認識方法を提供てきる。
【図面の簡単な説明】
第1図は本実施例の文字認識装置の構成を示すブロック
図、 第2図は本実施例の文字認識装置の処理手順を示すフロ
ーチャート、 第3図は対象文字と辞書の類似度を求める手順を示すフ
ローチャート、 第4図は確率パターン作成の手順を示すフローチャート
、 第5図(A)〜(C)は3つの標準パターンを示す図、 第6図は第5図(A)〜(C)の3つの標準パターンよ
り求められる各画素の黒である確率パターンを示す図、 第7図は第5図(A)〜(C)の3つの標準パターンよ
り求められる各画素の白である確率パターンを示す図、 第8図は入カバターン例を示す図である。 図中、1・・・cp、u、2・・・ROM、3・・・R
AM、3a・・・類似度記憶部、3b・・・しきい値記
憶部、3c・・・カウンタi、3d・・・カウンタj、
4・・・認識辞書、4a・・・確率パターン格納部、4
b・・・確率パターン格納部、5・・・入力インタフェ
ース、6・・・スキップ、7・・・入出力インタフェー
ス、8・・・CRT、9・・・プリンタ、 10・・・文書格納部で ある。

Claims (1)

  1. 【特許請求の範囲】 入力されたパターンを標準パターンと比較してパターン
    を同定するパターン認識方法であつて、同一パターンに
    対応する複数種類の標準パターンに基づいて、予め各画
    素について類似確率を求め、 入力された前記パターンの各画素に対応して前記類似確
    率を累積することにより類似度を求めることを特徴とす
    るパターン認識方法。
JP1331254A 1989-12-22 1989-12-22 パターン認識方法 Pending JPH03192487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1331254A JPH03192487A (ja) 1989-12-22 1989-12-22 パターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1331254A JPH03192487A (ja) 1989-12-22 1989-12-22 パターン認識方法

Publications (1)

Publication Number Publication Date
JPH03192487A true JPH03192487A (ja) 1991-08-22

Family

ID=18241630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1331254A Pending JPH03192487A (ja) 1989-12-22 1989-12-22 パターン認識方法

Country Status (1)

Country Link
JP (1) JPH03192487A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737041A (ja) * 1993-07-01 1995-02-07 Internatl Business Mach Corp <Ibm> パターン認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737041A (ja) * 1993-07-01 1995-02-07 Internatl Business Mach Corp <Ibm> パターン認識方法

Similar Documents

Publication Publication Date Title
US5889885A (en) Method and apparatus for separating foreground from background in images containing text
US7327882B2 (en) Method and device for character location in images from digital camera
JP2940936B2 (ja) 表領域識別方法
EP0840498A2 (en) Method and apparatus for pattern matching encoding
JPS62221785A (ja) パタ−ン認識方式において使用する特徴抽出技術
CN111461131A (zh) 身份证号码信息识别方法、装置、设备及存储介质
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
CN115270839A (zh) 一种基于PPYOLOv2模型的工业场景QR Code检测与识别方法
EP2223265A1 (en) A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character
JPH03192487A (ja) パターン認識方法
EP3702958A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
JP2832928B2 (ja) 文字認識方法
JP3127413B2 (ja) 文字認識装置
JPH0495180A (ja) 線分・曲線認識方式
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2708604B2 (ja) 文字認識方法
JPH0656625B2 (ja) 特徴抽出方式
CN117252767A (zh) 文本图片矫正方法及装置
JP3084833B2 (ja) 特徴抽出装置
JP2732753B2 (ja) ファジィパターン認識装置
JP3578247B2 (ja) 文字認識方法および装置
JPS6089290A (ja) パタ−ン認識方法
CN116758570A (zh) 非结构文档识别方法及系统
CN112507921A (zh) 基于目标区域的图形搜索方法、系统、电子装置及存储介质