JPH0241588A - 未知パターン認織結果のリジェクト方法 - Google Patents

未知パターン認織結果のリジェクト方法

Info

Publication number
JPH0241588A
JPH0241588A JP63190640A JP19064088A JPH0241588A JP H0241588 A JPH0241588 A JP H0241588A JP 63190640 A JP63190640 A JP 63190640A JP 19064088 A JP19064088 A JP 19064088A JP H0241588 A JPH0241588 A JP H0241588A
Authority
JP
Japan
Prior art keywords
similarity
rejection
pattern
threshold value
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63190640A
Other languages
English (en)
Inventor
Kazuyuki Yoshida
收志 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP63190640A priority Critical patent/JPH0241588A/ja
Publication of JPH0241588A publication Critical patent/JPH0241588A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、パターン認識における未知パターン認識結果
のリジェクト方法に関するものである。
〔従来の技術〕
第3図は従来の文字パターン認識のアルゴリズムを示す
流れ図である。同図に示すように、認識の対象とする文
書が入力されると、該文書を走査して光電変換した後、
文字切り出し、ベクトル化、大きさの正規化、停止・伝
播処理、類似度計算を行い、類似度の最大値を検出し、
該最大値を持つ標準文字パターンの属する文字カテゴリ
ーを認識結果(読取結果)として出力していた。
〔発明が解決しようとする課題〕
以上説明した如き従来のパターン認識技術においては、
上述のアルゴリズムを満足する限り、必ず読取結果を出
力していた。しかしこの方法だと、切り出した文字が人
間が見ても認識できないような汚れた文字とか、かすれ
たような文字であっても、恰も正しく認識できたかのよ
うにして実際には間違っている読取結果を出力すること
になるという問題点があった。
本発明の目的は、文字パターンの認識において、認識対
象とする文字パターンが、上述のように人間が見ても認
識できないような汚れた文字とか、かすれたような文字
である場合には、そのことを識別して認識結果(読取結
果)をリジェクトすることのできる未知パターン認識結
果のりジエクト方法を提供することにある。
〔課題を解決するための手段〕
上記目的達成のため、本発明では、未知パターンと標準
文字パターンとの比較を行い、未知パターンと最も類似
度の高い標準文字パターンを定め、その標準文字パター
ンの属する文字カテゴリーを認識結果とするパターン認
識において、各標準文字パターン毎に、認識対象とする
サンプルパターンを所要個数集めてそれぞれの類似度を
求めて正規分布に近似した類似度の度数分布を得た後、
該分布における或る類似度の発生確率が或る所与の%を
満たす如き、当該類似度を選択して予めしきい値と定め
ておき、未知パターンの当該標準文字パターンに対する
類似度が前記しきい値に達しないとき、該未知パターン
の認識結果をリジェクトすることとした。
〔作用〕
標準文字パターンが例えば「あ」という文字であるとす
ると、認識対象とするサンプルパターンは、同じ文字「
あ」でも、子供の書いた文字とか大人の書いた文字、或
いは習字の先生が書いた文字などのように、色々のサン
プルがあるので、−方に偏することのないようにそれら
サンプルをなるべく多数集め、それぞれの標準文字パタ
ーン「あ」に対する類似度を求めて統計処理すると、正
規分布に近似した類似度の度数分布を得ることができる
この度数分布(正規分布)において、或る類似度の発生
確率が1%なら1%となる如き当該類似度を求め、これ
をしきい値とし、従来技術における前述のアルゴリズム
を満たした認識結果であっても、そのとき得られた類似
度がこのしきい値に達しない場合はこれをリジェクトす
るのである。
発生確率のとりがた次第でリジェクトのしきい値を自由
に変え得るようにしておけば、ケース・パイ・ケースで
確実な読取結果を得ることができる。
またこのようにして自動的なりジエクトが行われれば人
間がそのことに気付いてその個所を修正することが容易
になる。
〔実施例〕
以下、必要に応じて図を参照しながら本発明の詳細な説
明する。
類似度計算を行うためには、辞書(標準)パターンが必
要である。S (i)(i=1.・・・、n:但しnは
辞書を構成する標準文字パターンの総数)を辞書パター
ンとする。n個の標準文字パターンのそれぞれに対して
、m個ずつのサンプルパターンを用意し、対応する標準
文字パターンについて、m個のサンプルパターンの各類
似度を求めX (i。
j)(但し、iは標準文字パターンを表わしていてi=
1.・・・、nHjはサンプルパターンを表わしていて
j=1.・・・、m)とする。
さらに、このようにして1個の標準文字パターンについ
てm個得られる類似度の平均値をとってX (i)(i
=1.・・・、n)とし、これを基準点とする。また、
各標準文字パターン毎のm個の類似度の度数分布から標
準偏差σ(i)(i=1゜・・・、n)を求める。サン
プル数mを十分大きな値とすれば、m個の類似度の度数
分布は正規分布とみなせるようになる。
第4図はかかるm個の類イ以度の度数分布(正規分布)
を示したグラフである。同図において、横軸に類似度を
とり縦軸にその頻度(度数)をとっている。サンプルパ
ターンの数mを適切に多数とればかかる正規分布に近い
度数分布が得られる。
なお類似度の最高点(満点)を1000としている。
次にリジェクトのしきい値の決め方を説明する。
例えば第4図の度数分布において、下位から全体個数の
1%に相当する個数に対応した類似度Yは幾らであるか
を求め、それをしきい値とすれば、下位から発生確率1
%以下をリジェクトすることができる。
以下、このように下位から発生確率1%以下をリジェク
トする場合について考える。
各標準文字パターン毎の類似度の度数分布におと置いて
標準化して考えると、分布関数Φ(Z)は次式(1)の
様に表わされる。
Φ (z)=  S   φ(z)dz・・・・・・ 
(1) 従ってリジェクトしきい値を求めるためには次式(2)
を解けばよい。
φ(z)dz=o、ol これを解くとZ#−2,33となる。従ってこれに対す
る類似度X (i)の値は (3)式から得られる。
X (i)=X (i)  2.33・σ(i)・・・
・・・(3) 従って、各標準文字パターン毎のリジェクトしきい値R
(i)は次の(4)式で求められる。
R(i) −X (i) −2,33・σ(i)(i−
1,・・・、n)    ・・・・・・(4)これによ
り例えばある未知パターンPに対しての認識結果がQで
あり、その標準文字パターン5(K)に対する当該未知
パターンPの類似度がYであったとして、 y<R(K) =X (K) −2,33・σ(K)・
・・・・・ (5) が成り立つ時は、その認識結果Qはリジェクトされる。
この方法によれば、各標準文字パターンごとにあらかじ
め類似度の平均値X (i)、類似度の度数分布の標準
偏差σ(i)を求めておくことにより、下位から発生確
率何%を満たす類似度の所にリジェクトのしきい値を設
定するかによりリジェクトの強度を自由に変更できる。
例えば、1%の所にしきい値を設定していたものを10
%の所に変更すればりジェツトの強度は強くなるわけで
ある。具体的な数値をもとに計算してみる。
今「あ」という文字の標準文字パターンがあり、100
文字の「あ」 (サンプルパターン)に対し、類似度計
算をした結果、その平均点X=850、標準偏差σ=8
0であったとする。下位から1%の発生確率を満たす類
似度の所でリジェクトする場合のリジェクトしきい値R
1は R1=850−2.33X80=663.6・・・・・
・(6) であり、下位から10%の所でリジェクトする場合のリ
ジェクトしきい値R2は R2=850−1.28X80=747.6・・・・・
・ (7) となる。
従って、ある未知パターンに対して認識結果がこの「あ
」になった場合、類似度Xが X<R1(<R2) の場合、しきい値をR1,R2のどちらに選んでいても
リジェクトされ、 R1≦ X <R2 の場合、しきい値をR2に選んだ場合にのみリジェクト
される。また、 R1<R2≦X の場合には、しきい値をR1,R2のどちらに選んだ場
合にもリジェクトされることはない。
第1図は、以上説明した動作原理に対応する本発明の一
実施例を示す概念図である。
同図において、11は或る標準文字パターン(その属す
るカテゴリーをKiとする)に対する或る未知パターン
の類似度を演算する類似度演算器、12は演算器11に
おける演算の結果得られた類似度Xkiを格納しておく
レジスタ、13は予め求めである様々なリジェクトしき
い値(R(i)・・・R(i)・・・R(n))を記憶
しておくことのできるテーブル、14は比較演算を行う
CPU、15,16はそれぞれ出力、である。
今テーブル13においてリジェクトしきい値としてR(
i)が記憶されているものとする。CPU14は、レジ
スタ12から取り込んだ類似度Xkiをテーブル13か
ら取り込んだリジェクトしきい値R(i)と比較し、そ
の結果、類似度Xkiがリジェクトしきい値R(i)以
下であれば、リジェクト出力16を出力し、そうでなけ
れば認識結果出力15としてカテゴリーKiを出力する
テーブル13に記憶するリジェクトしきい値を書き変え
ることによりリジェクトの範囲を様々に可変できること
は述べるまでもないであろう。
以上はリジェクトしきい値として類似度を用いる例であ
った。リジェクトしきい値として類似度を用いる代わり
に発生確率を用いることも勿論可能である。この場合の
動作原理について以下説明する。
カテゴリーKをもつ或る標準文字パターンに対する所要
数のサンプルパターンの各類似度の度数分布Ω(K)を
正規分布Nk(Xk、  σk)で近似することにより
(但し−Xkは平均値、σには標準偏差)、未知文字パ
ターンUの前記標準文字パターンに対する類似度YUが
カテゴリーにである確率Pk  (U)を次式の発生確
率として定義する。
σに 未知文字パターンの候補文字Ul、U2・・・UIOの
各類似度YUI、 YO2,・・・・・・Y UIOか
ら前記(8)式で、発生確率を求めて、Pkl、  P
k2.・・・・・・P kl。
とし、これらが予め定めたりジェツトのしきい値PRよ
り小さいとき、リジェクトし、そうでないときはリジェ
クトしない。
この様子を第2図に示す。第2図において、カテゴリー
に1に対応する正規分布に対して候補文字U1の類似度
から求めた発生確率Pklが図示せざるリジェクトしき
い値PRより小さければリジェクトされる。カテゴリー
に2に対応する正規分布に対して候補文字U2の類似度
から求めた発生確率Pk2が図示せざるリジェクトしき
い値PRより大きければリジェクトされず、OKとなる
同様にカテゴリーに3に対応する正規分布に対して候補
文字U3の類似度から求めた発生確率Pk3がリジェク
トしきい値PRより大きければリジェクトされず、OK
となる。
〔発明の効果〕
この発明によれば、あらかじめ求めておいた各カテゴリ
ーに属する標準文字パターンの類似度の度数分布を近似
した正規分布(文字パターンごとの基準点(平均点)、
標準偏差)をもとに発生確率で決定したりジェツトのし
きい値により、類似度の低いものをリジェクトする様に
したので、入力画像の汚れ、かすれ、或るいは辞書に全
くない様なパターンを認識し、点数が低くなった場合リ
ジェクトできる様になり、安定した確実な認識結果が得
られ、さらにリジェクトされたことを知ることにより修
正箇所が即座に認知でき、人手による修正が容易になっ
た。
また、リジェクトのしきい値(範囲)を自由に設定でき
るので、より確実な認識結果をその都度得られる様にな
った。
【図面の簡単な説明】
第1図は本発明の一実施例を示す概念図、第2図は本発
明によるリジェクト方法の一例を示す説明図、第3図は
従来の文字パターン認識のアルゴリズムを示す流れ図、
第4図はm個の類似度の度数分布(正規分布)を示した
グラフ、である。 符号の説明 11・・・類似度演算器、12・・・レジスタ、13・
・・しきい値記憶テーブル、14・・・CPU、15.
16・・・出力 代理人 弁理士 並 木 昭 夫 代理人 弁理士 松 崎   清 第1 C1地 0ル 「 レウm7)圧 し!ナル [j:!正I しILi 「i易]j 」 N石i 図 114  図

Claims (1)

  1. 【特許請求の範囲】 1)未知パターンと標準文字パターンとの比較を行い、
    未知パターンと最も類似度の高い標準文字パターンを定
    め、その標準文字パターンの属する文字カテゴリーを認
    識結果とするパターン認識において、 各標準文字パターン毎に、認識対象とするサンプルパタ
    ーンを所要個数集めてそれぞれの類似度を求めて正規分
    布に近似した類似度の度数分布を得た後、該分布におけ
    る或る類似度の発生確率が或る所与の%を満たす如き、
    当該類似度を選択して予めしきい値と定めておき、未知
    パターンの当該標準文字パターンに対する類似度が前記
    しきい値に達しないとき、該未知パターンの認識結果を
    リジェクトすることを特徴とする未知パターン認識結果
    のリジェクト方法。
JP63190640A 1988-08-01 1988-08-01 未知パターン認織結果のリジェクト方法 Pending JPH0241588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63190640A JPH0241588A (ja) 1988-08-01 1988-08-01 未知パターン認織結果のリジェクト方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63190640A JPH0241588A (ja) 1988-08-01 1988-08-01 未知パターン認織結果のリジェクト方法

Publications (1)

Publication Number Publication Date
JPH0241588A true JPH0241588A (ja) 1990-02-09

Family

ID=16261437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63190640A Pending JPH0241588A (ja) 1988-08-01 1988-08-01 未知パターン認織結果のリジェクト方法

Country Status (1)

Country Link
JP (1) JPH0241588A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59205681A (ja) * 1983-03-30 1984-11-21 Comput Basic Mach Technol Res Assoc 文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59205681A (ja) * 1983-03-30 1984-11-21 Comput Basic Mach Technol Res Assoc 文字読取装置

Similar Documents

Publication Publication Date Title
JP2607457B2 (ja) パターン認識装置
CN110555140B (zh) 面向口令猜测的语料乘积规则的描述、生成与检测方法
Saadat et al. A GSA-based method in human identification using finger vein patterns
EP2073146A1 (en) Pattern recognizing device for recognizing input pattern by using dictionary pattern
Anigbogu et al. Hidden Markov models in text recognition
JPH0241588A (ja) 未知パターン認織結果のリジェクト方法
Tung et al. Increasing character recognition accuracy by detection and correction of erroneously identified characters
JP4116688B2 (ja) 辞書学習方法および文字認識装置
JP2556477B2 (ja) パタン照合装置
JP3659688B2 (ja) 文字認識装置
LAM Theory and application of majority vote: From condorcet jury theorem to pattern recognition
JPH05324805A (ja) パターン認識装置及び個人照合装置
JP4666875B2 (ja) 単語照合方法及び文字認識装置
JP4285960B2 (ja) 文字認識装置及び文字認識方法
JPS6272085A (ja) 文字認識装置
JPH08101880A (ja) 文字認識装置
JP4143148B2 (ja) 文字認識装置
Negi et al. Candidate Search and elimination approach for telugu OCR
JPH02138682A (ja) 文字認識方法
Tung et al. 2-stage character recognition by detection and correction of erroneously-identified characters
Lam et al. Rejection versus error in a multiple experts environment
JP2851865B2 (ja) 文字認識装置
JP3446769B2 (ja) 文字認識装置
JP3111522B2 (ja) 認識文字修正方法
JPH06231310A (ja) 文字認識装置における文字認識方法