JPS638884A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS638884A
JPS638884A JP61151369A JP15136986A JPS638884A JP S638884 A JPS638884 A JP S638884A JP 61151369 A JP61151369 A JP 61151369A JP 15136986 A JP15136986 A JP 15136986A JP S638884 A JPS638884 A JP S638884A
Authority
JP
Japan
Prior art keywords
similarity
maximum similarity
pattern
category
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61151369A
Other languages
English (en)
Inventor
Akio Sannomiya
三宮 昭夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61151369A priority Critical patent/JPS638884A/ja
Publication of JPS638884A publication Critical patent/JPS638884A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、例えば光学的に読み取った入力パターンを
認識する文字読取装置に関する。
(従来の技術) 光学的に文字を読み取る光学的文字読取¥&置(一般に
OCRと称する)は従来法のような識別判定論理を使用
して文字認識を行なっている。
すなわち、カテゴリを史、カテゴリ数をN、各カテゴリ
の類似度値を5(z)とした時、最大類似度5ffla
Xおよび最大類似度とこの最大類似度の次に最も類似し
ている準最大類似度との類似度差ΔSは次式のようにな
る。
(え)。
Sa+ax =max  (S  、 1=1−N) 
   ・(+)tL)  。
ΔS=Smax −max  (S  、 1=1−N
> ・(2)(但し、3 waxのカテゴリを除く)こ
の時未知パターンfがカテゴリ吏′であると判定するの
に次式を使用している。
5Ilax≧S L 1             ・
(3)ΔS ≧SL2             ・・
・(4)ここにおいて、(3)式は類似度の最大(直が
一定の閾値以上であることを示し、(4)式は他のカテ
ゴリとの分離性を示す指標値を示している。
今、同じカテゴリに嵐する多くのパターンの最大類似度
5Ila×および類似度差ΔSの分布状態を調べると、
第5図の(a )、(b)、(c)のようになる。第5
図は縦軸に最大類似度3 a+axを取り、横軸に類似
度差ΔSを取った図である。図において、(+)1 、
 (+>2 、<+)3はカテゴリが正しく認識された
時、すなわち正読時の分布を示し、(2)盲 、(2)
2 、(2)3 、は誤って認識された時、すなわち誤
読時の分布を示すものである。上式(3)、(4)に従
って閾値SL1.SL2を定め、この閾値を第5図にあ
てはめると、第5図(a)、■において斜線で示す(A
)1部分および(A)2は正しく認識されたにもかかわ
らず誤認識され、読取拒絶(リジェクト)として処理さ
れる。
(発明が解決しようとする問題点) 第5図に示すように正読時の分布と誤読時の分布とは明
確に分離されているにもかかわらず、従来の閾値SL1
.SL2に従って認識すると、斜線部分で示す(A)+
 、(A)2部分のように正しく分離して分布している
のに誤認識されてしまうという問題がある。第5図(a
)、(b)は説明のために正読と誤読の分布をかなり分
離して示しているが、実際には第5図(C)に示すよう
に両分布は互いに干渉し合うようになっている。従って
、このような場合には従来のような直線状の閾値設定方
式では正続率を向上することができないという問題があ
る。
この発明は、上記に鑑みてなされたもので、その目的と
するところは、入力パターンを非直線間値v制御により
適確に認識して正読率を向上した文字読取装置を提供す
ることにある。
[発明の構成] (問題点を解決するための手段) 上記問題点を解決するため、この発明は、入力パターン
を格納するパターン格納部と、基準パターンを記憶して
いる辞書部と、前記入力パターンの前記基準パターンに
対する類似度を計算し、該類似度から最大類似度、該最
大類似度に対するカテゴリおよび最大類似度と最大類似
度の次に最も類似している準最大類似度との類似度差を
求める計算部と、前記カテゴリに対する最大類似度およ
び類似度差の分布から最大類似度および類似度差のそれ
ぞれの平均値および分散値を含む統計量を求める統計量
計算部と、前記統計量に基づく非直線閾値により未知入
力パターンを識別する識別部とを有することを要旨とす
る。
(作用) この発明の文字読取装置においては、入力パターンの基
準パターンに対する最大類似度、該最大類似度に対する
カテゴリおよび最大類似度と準最大類似度との類似度差
を求め、該カテゴリに対する最大類似度および類似度差
の分布からそれぞれの平均値および分散値を含む統計量
を求め、この統計量に基づく非直線閾値により未知入力
パターンを適確に認識している。
(実施例) 以下、図面を用いてこの発明の詳細な説明する 第1図はこの発明の一実施例に係る文字読取装置のブロ
ック図であり、第2図は文字読取装置の概略構成を示す
ブロック図である。
まず、第2図を参照して、概略的に構成を説明する。第
2図の文字読取装置は文字パターンを光学的に走査して
読み取り吊子化するスキ11す部200を有している。
このスキレナ部200は光学的に文字パターンを走査す
る走査部100と、該走査部100の出力を8子化する
母子化・#i処理部110と、該吊子化・前処理部11
0の出力からパターンを検出して切り出すパターン検出
・切出5120とからなり、このスキャナ部200で読
み取られた文字入力パターンは辞書部220からの基準
パターンと類似度計算部210において比較され、基準
パターンに対する類へ度が口出される。類似度計算部2
10は算出した類似度から最大類似度5Illa×、最
大類似度3 maxに対するカテゴリおよび最大類似度
5IIla×と次に最も類似している準最大類似度との
類似度差ΔSを求めるとともに、該カテゴリに対する最
大類似度Swaxおよび類似度差ΔSの分布からそれぞ
れの平均値および分散値を含む統計量を求め、識別判定
・答編集部230に供給している。識別判定・答編集部
230はこの統計量に基づく非直線閾値により未知入力
パターンを適確に識別している。なお、この文字読取装
置の全体の動作は制御部240により制御されている。
次に、第1図の実施例の文字読取装置の構成を説明する
。第1図において、20はスキャナ(SCN)であり、
このスキャナ20は前記第2図の走査部100.ffi
子化・前処理部110、パターン検出・切出部120を
有するスキャナ部200に対応している。このスキャナ
20で光学的に走査して読み取った入力パターンはパタ
ーンバッファ(f)10および正解教示バッファ (A
TBL)14に供給され、パターンバッファ10を介し
た入力パターンは類似度計算部(SIM)12および蓄
積部(f 、ATBL)19に供給されている。
正解教示バッファ14はパターン<r>に対する正解を
与える機能を有している。なお、この文字読取装置は大
別して後述する統計rを求める第1の処理と、この第1
の処理において決定された値から入力パターンの識別判
定を行なう第2の処理からなる2つの処理を行なうよう
になっている。
上記蓄積部19は第1の処理を行なうための入力パター
ンおよび正解を蓄積し、また上記スキャナ20は第2の
処理において識別すべき未知パターンを入力するために
使用されている。そして、スキャナ20からの入力パタ
ーンを使用するかまたは蓄積部19に蓄積されたパター
ンを使用するかの選択制御は本文字読取装置の全体を制
御する制御1FII (CNTL) 1Bからの選択I
!38を介して供給される選択信号により行なわれてい
る。制御部18は第2図の制御部240に対応するもの
である。
パターンバッファ10から出力される入力パターンは類
似度計算部12において前記辞書部220に対応する辞
書部(φ)11からの基準パターンと比較され、入力パ
ターンの基準パターンに対する類似度値およびそのカテ
ゴリデータが算出され、この類似度値およびカテゴリデ
ータは計算ソート部(SRT)13に供給される。この
動作は辞書部11の指定カテゴリのすべてについて実施
され、そのすべての結果が計算ソート部13に供給され
ると、計算ソート部13は類似度計算部12から供給さ
れた類似度から最大類似度3 iaxおよび最大類似度
31aXと次に最も類似している準最大類似度との類似
度差ΔSを算出する。計算ソート部13はこの算出した
最大類似度Smax、類似度差ΔSおよびそのカテゴリ
データ等の情報を統計か計算部(SLC)15および識
別判定部(ASRJ)17に供給する。更に詳細には、
第1の処理を行なっている場合には、制御部18からの
制御線39を介した制御信号により計算ソートi13か
らの上記情報は統計囲計算部15に供給され、また第2
の処理を行なっている場合には、制御部18からの制御
線38からのv制御信号により計算ソート部13からの
上記情報は識別判定部17に供給されるようになってい
る。なお、類似度計算部12および計算ソート部13は
第2図の類似度計算部210に対応し、識別判定部17
は第2図の識別判定・谷編集部230に対応している。
そして、統計闇討締部15は、計算ソートgB13から
供給される最大類似度3max、類似度差ΔSおよびカ
テゴリデータ等の情報に対して後述する計算を行なっ−
で、各種統計グを求め、各カテゴリに対して正読および
誤読の判定を行ない、且つ統計量を統計量蓄積部(ST
BL)16に蓄積する。統計量蓄積部16は統計量計算
部15から供給される情報をカテゴリ別にテーブル化し
て後述するテーブルのように蓄積する。このように各種
統計Mが統計量蓄積部16に蓄積されるまでの動作が第
1の処理である。
また、識別判定部17は、計算ソート部13からの最大
類似e、5IIla×、類似度差ΔSおよびカテゴリデ
ータ等の情報および統計量蓄積部16に蓄積されている
上記各種統計量を受信し、統計量蓄積部16からの統計
量情報等に基づく非直線閾値制御に従って計算ソート部
13から供給される情報の入力パターンを識別し、その
結果を出力信号37として出力している。このように識
別判定を行なう処理が第2の処理である。
次に、第3図を参照して非直線rsvi制御について説
明する。
今、入力パターンの基準パターンに対する類似度を算出
し、その最大類似度Smaxおよび最大類似度S wa
xと次の最大類似度との類似度差ΔSの分布状態を図示
した結果、第3図に示すように符号1で示す正続分布と
符号2で示す誤読分布が得られたとする。
この正読分布1における最大類似度3 maxおよび類
似度差ΔSの各平均値、すなわち第3図において正読分
布1の中心点C1に相当する各平均値をそれぞれμ’I
+μC2とし、誤読分布2における最大類似度3 ti
axおよび類似度差△Sの各平均値、すなわち第3図に
おいて誤読分布2の中心点C2に相当する各平均値をそ
れぞれμEl、μE2とする。なお、これらおよび以下
において添字の「CJは正読を意味し、rEJは誤読を
意味し「1」は最大類似度3 waxを意味し、「2」
は類似度差ΔSを意味する。また、正読分布1および誤
読分布2における最大類似度3 waxおよび類似度差
ΔSのIfA準偏差をそれぞれσCI+ σC2および
σE+、σE2とする。この結果、正読分t51は点C
+  (μC1,μC2)を中心にσC1゜σc2.お
よび誤読分布2は点C2(μ[1,μE2)を中心にσ
El、σE2をそれぞれ長径および短径とする楕円形で
ある。
第3図に示すように上述した楕円形に分布する正読分布
1と誤読分布2とを明確に分離し、正読分布1に入るも
のを誤読せずに適確に認識するためには、正読分布1と
誤読分布2との間に太い実線下Hで示ずように点A+ 
、B+ 、B2 、A+ を結ぶ非直Is閾値を設定す
ることが好ましい。この非直線閾値は次式により画定す
ることができる。
Smax < 31 、(2)           
  ・+s>ΔS  <5L2(2)        
    ・・・(6)(3n+ax−μE+)2+(Δ
S−μE2)2く(x・σEl −σE 2 )   
 ・・17)SlaX<SL+”)=μE++x争(7
E+  ”・(8)(但し、O≦Δ$〈μE2) ΔS  <sL2”’=μt: 2 +x ・σE2 
−<9)(但し、0≦5IlaX <μE I  )な
お、式(5)、(6)におけるS L 1”および5L
2(2)は最低保障値として与えられるデータである。
上式(5)〜(9)を満たす場合が読取拒否(リジェク
ト)である。そして、そのリジェクトされたパターン数
をRとし、式(5)〜(9)以外で誤ったパターン数を
Eとすると、次式で示す評価関数Fが成立する。
F=R+α・E           ・・・(ゆこの
式において、αは定数(≧0)である。この評価関数は
リジェクトされるパターン数を表している。従って、こ
の評i関数Fが最小になるように非直線閾値を設定すれ
ばよいことになる。このため、この評(i!li関数が
最小になるように式(7)〜(9)における変数X(≧
O)を決定し、この変数Xに対して第3図のように変数
X (α)=鰯となるように非直lit間値が設定され
るのである。従って、このようにリジェクトを最小にし
、評価finを最小にするように非直線閾値を設定する
各式(5)〜〈9)に従って未知入力パターンを識別判
定すればよい。
そして、このように非直線vlJlilIを設定すべく
入力パターンの基準パターンに対する最大類似度3ma
Xおよび前記類似度差△Sの分布から上述した各統計量
、すなわちμC1,μC2,μE+、μE2、σC1,
σc2.σE+、σε2等を前記統計醗計算部15で算
出し、これらを統計量蓄積部16に!積し、識別判定部
17において未知入力パターンの識別判定に使用すれば
よいのである。
なお、上記統計量が統計量蓄積部16に蓄積されるテー
ブル形式は、til制御部18により制御できる形式で
あれば特にi、IJ限されず自由であるが、例えば次の
ようなテーブル形式であってもよい。なお、このテーブ
ルでび)nはパターン数である。
(以下余白) 以下、第4図のフローチャートを参照して第1図の文字
読取装置の作用を説明する。
まず、動作モードが第1の処理動作か、蓄積モードかが
チェックされ(ステップ310.320)、最初は蓄積
モードを実行するステップ330に進む。ステップ33
0では、スキャナ20で読み取ったパターンをパターン
バッファ10を介して蓄積部19に蓄積する。この動作
を蓄積モードが終了するまで行なう(ステップ340)
スキャナ20で読み取ったパターンをすべて蓄積部19
に蓄積し、蓄積モードを終了すると、ステップ400に
進んで第1の処理動作に入る。
第1の処理動作においては、まず蓄積部19に蓄積され
たパターンカテゴリをl (1=1−L)、このパター
ン数を//nとし、u=1−Lについて次ステツプ41
0および440を実行する。
ステップ410は1.1 U)nについてステップ42
0.430を実行する。すなわち、まず蓄積モードで蓄
積部19に蓄積されている入力パターンをパターンバッ
ファ10を介して類似度計算部12に供給しくステップ
420)、この類似度計算部12において辞書部11か
ら供給される辞1カテゴリ吏−(1−−1−L)の辞書
パターン(j″φと入力パターンfとの類似度を算出す
る。
辞書カテゴリ吏−内における最大類似度を5Illax
とし、準最大類似度との類似度差を△Sとし、最大類似
度S n+axが吏=吏′の時は正読とし、吏≠髪−の
時は誤読として、これらのデータを統計侶計算部15に
蓄積する(ステップ430)。
統計団計算部15は、これらのデータから前記第3図で
説明したように正続時の最大類似度5IIlaXおよび
類似度差ΔSの平均値および標準偏差、すなわちμc1
.σCI+μc2.σC2を口出するとともに、誤読時
の最大類似度3 maxおよび類似度差ΔSの平均値お
よび標準偏差、すなわちμE1.σE+、μE j、σ
E2をσ出し、上述したテーブル形式で統計伝蓄積部1
6に蓄積しくステップ440)、第1の処理を終了する
第1の処理が終了すると、ステップ500以降の第2の
処EJ!動作に進む。
第2の処理では、まずパターンバッファ10への入力パ
ターンを蓄積部19からスキャナ20に切り換え、スキ
17す20で読み取った未知入力パターンを受信するよ
うに制御する(ステップ500)。
スキャナ20で読み取った未知入力パターンをパターン
バッファ10を介して類似度計算部12に供給し、この
パターンfを辞書部11から供給される辞書カテゴリ吏
′(愛′=1−L)の辞書パターンC1’)φとの類似
度を口出する。この類似度は計算ソート部13に供給さ
れ、この計算ソート部13に43いて最大類似度Sma
x、類似度差ΔSおよび最大類似度5fflaxのカテ
ゴリが求められ、識別判定部17に供給される(ステッ
プ520)。
識別判定部1゛7は、上述したように第1の処理動作で
求められ統計団蓄積部16に蓄積されているカテゴリデ
ータに基づき、且つ上述した式(5)〜(9)に従って
設定される非直線閾値によって計算ソート部13からの
データを識別判定する。そして、式(5)〜(9)の条
件に該当しない場合には、計算ソート部13から供給さ
れた最大類似度Smaxのカテゴリが正解として識別判
定部17から出力され、式(5)〜(9)の条件に該当
する場合には、リジェクトとして識別判定部17から出
力される(ステップ530)。次のパターンがある場合
には、ステップ510を繰返す(ステップ540)。
また、上記処理動作における蓄積モードにおいて蓄積部
19に未知パターンを蓄積し、これを蓄積モード終了後
の第1の処理動作の実施において統計ei積部16に格
納して統計量を更新することができる。
なお、上記第1の処理動作は辞MH計時におけるシミュ
レーションに相当し、第2の処理動作はOCR実使用時
に相当するものと考えられる。また、第1図においては
、統計量計算部15および蓄積部19を制御部18の制
御により動作するように説明してい・るが、統計G蓄積
部16において上述したテーブルを作成するには必ずし
も同一制御下で動作しなくてもよい。
[発明の効果コ 以上説明したように、この発明によれば、入力パターン
の基準パターンに対する最大類似度、該最大類似度に対
するカテゴリおよび最大類似度と準類似度との類似度差
を求め、該カテゴリに対する最大類似度および類似度差
の分布からそれぞれの平均値および分散値を含む統計量
を求め、この統計量に基づく非直線閾値により入力パタ
ーンをWl nしているので、入力パターンは適確に識
別判定され、正続率を向上することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る文字読取装置のブロ
ック図、第2図は文字読取装置の概略構成図、第3図は
第1図の実施例における非直線量値制御を説明するため
の最大類似度と類似度差の分布を示す図、第4図は第1
図の文字読取装置の作用を示すフローチャート、第5図
は従来の文字読取装置における閾1直設定方式を説明す
るための最大類似度と類似度差の分布を示す図である。 11・・・辞書部 12・・・類似度計算部 13・・・計算ソート部 15・・・統計量計算部 16・・・統計量蓄積部 17・・・識別判定部 18・・・制御部 19・・・蓄積部 20・・・スキャナ

Claims (1)

    【特許請求の範囲】
  1. 入力パターンを格納するパターン格納部と、基準パター
    ンを記憶している辞書部と、前記入力パターンの前記基
    準パターンに対する類似度を計算し、該類似度から最大
    類似度、該最大類似度に対するカテゴリおよび最大類似
    度と最大類似度の次に最も類似している準最大類似度と
    の類似度差を求める計算部と、前記カテゴリに対する最
    大類似度および類似度差の分布から最大類似度および類
    似度差のそれぞれの平均値および分散値を含む統計量を
    求める統計量計算部と、前記統計量に基づく非直線閾値
    により未知入力パターンを識別する識別部とを有するこ
    とを特徴とする文字読取装置。
JP61151369A 1986-06-30 1986-06-30 文字読取装置 Pending JPS638884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61151369A JPS638884A (ja) 1986-06-30 1986-06-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61151369A JPS638884A (ja) 1986-06-30 1986-06-30 文字読取装置

Publications (1)

Publication Number Publication Date
JPS638884A true JPS638884A (ja) 1988-01-14

Family

ID=15517044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61151369A Pending JPS638884A (ja) 1986-06-30 1986-06-30 文字読取装置

Country Status (1)

Country Link
JP (1) JPS638884A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7339757B2 (en) 2004-03-18 2008-03-04 Fujinon Corporation Lens barrel
JP2010204766A (ja) * 2009-02-27 2010-09-16 Glory Ltd 文字認識方法および文字認識装置
US9645346B2 (en) * 2014-11-11 2017-05-09 Fluke Corporation Self-aligning doublet lens assembly

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7339757B2 (en) 2004-03-18 2008-03-04 Fujinon Corporation Lens barrel
JP2010204766A (ja) * 2009-02-27 2010-09-16 Glory Ltd 文字認識方法および文字認識装置
US9645346B2 (en) * 2014-11-11 2017-05-09 Fluke Corporation Self-aligning doublet lens assembly

Similar Documents

Publication Publication Date Title
EP0779595B1 (en) Fingerprint classification system
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
US4651289A (en) Pattern recognition apparatus and method for making same
US6249605B1 (en) Key character extraction and lexicon reduction for cursive text recognition
CA2375355A1 (en) Character recognition system and method
US20020114515A1 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
KR100837002B1 (ko) 패턴 식별 시스템, 패턴 식별 방법, 및 패턴 식별 프로그램을 기록한 기록매체
Toh Fingerprint and speaker verification decisions fusion
JPS638884A (ja) 文字読取装置
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
Bansal et al. Multimodal biometrics by fusion for security using genetic algorithm
CN112907541B (zh) 一种手掌图像质量评估模型构建方法及装置
EP0955600B1 (en) Process and equipment for recognition of a pattern on an item presented
JPH04111085A (ja) パターン認識装置
JPH08263655A (ja) パターン認識方法
JPH0896083A (ja) 文字認識装置
JP2797721B2 (ja) 文字認識装置
JP2906758B2 (ja) 文字読取装置
JP2906743B2 (ja) 文字認識装置
JPH1011541A (ja) 文字認識装置
KR970002424B1 (ko) 후보문자분류방법
JPH08329194A (ja) 文字認識装置
CN118115778A (zh) 图像中线段分类方法、皮带跑偏检测方法及装置
JP2658154B2 (ja) 文字識別方式