JPH05314317A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05314317A
JPH05314317A JP4114904A JP11490492A JPH05314317A JP H05314317 A JPH05314317 A JP H05314317A JP 4114904 A JP4114904 A JP 4114904A JP 11490492 A JP11490492 A JP 11490492A JP H05314317 A JPH05314317 A JP H05314317A
Authority
JP
Japan
Prior art keywords
character
pattern
similarity
input
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4114904A
Other languages
English (en)
Other versions
JP3110552B2 (ja
Inventor
Yuzo Maruta
裕三 丸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP04114904A priority Critical patent/JP3110552B2/ja
Publication of JPH05314317A publication Critical patent/JPH05314317A/ja
Application granted granted Critical
Publication of JP3110552B2 publication Critical patent/JP3110552B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 高い正解率で文字を認識することのできる文
字認識装置を得る。 【構成】 重み変更部9を設け、総合判定部8が正解文
字の文字コードとは別の誤った文字コードを出力した場
合に、操作者が正解文字の文字コードをこの重み変更部
9に入力することにより、各特徴についての類似度に対
する重みの値を、正解文字の文字コードに相当する認識
候補文字が最も高い総合類似度となるような値に変更す
る。即ち、この文字認識装置では、総合判定部8が総合
類似度の算出に用いる、各特徴についての類似度に対す
る重みの値を、文字パターンの、かすれ,つぶれ,右上
がりなどといった状況に応じた最適な値に変更すること
ができる。その結果、認識文字の正解率を高めることが
できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書の文字を認識し、
その認識文字の文字コードをコンピュータ等へ出力する
文字認識装置、特に、文字のパターンから複数の特徴を
抽出し、その抽出した複数の特徴に基づいて文字を認識
する文字認識装置に関する。
【0002】
【従来の技術】文字のパターンから複数の特徴を抽出
し、その抽出した複数の特徴に基づいて文字を認識する
方法については、例えば「大局的特徴を併用したストロ
ークマッチング法による手書き漢字認識の検討」(電子
通信学会技術研究報告PRL82−30,1982年)
に報告されている。
【0003】図6は、上記文献に基づく従来の文字認識
装置のブロック構成図である。
【0004】図のようにこの文字認識装置は、パターン
入力部1と、第一,第二,第三の三つの特徴抽出部2,
3,4と、第一,第二,第三の三つの類似度算出部5,
6,7と、総合判定部8とから構成されている。
【0005】上記構成において、パターン入力部1に文
書の文字のパターンが入力されると、パターン入力部1
は、第一,第二,第三の各特徴抽出部2,3,4へその
入力文字パターンを出力する。すると各特徴抽出部2,
3,4は、その入力文字パターンからそれぞれ異なる三
種類の特徴、例えばストローク特徴と方向特徴と特徴点
分布特徴とを抽出し、その抽出したそれぞれの特徴を、
対応する第一,第二,第三の各類似度算出部5,6,7
へ出力する。
【0006】各類似度算出部5,6,7は、各特徴抽出
部2,3,4で抽出されたそれぞれの特徴について、入
力文字パターンと、この文字認識装置に内蔵されている
認識辞書の複数の認識候補文字のパターンとの類似度S
1(k),S2(k),S3(k)を算出し、その算出
結果を総合判定部8へ出力する。上記S1(k),S2
(k),S3(k)は、それぞれストローク特徴と方向
特徴と特徴点分布特徴とについての、入力文字パターン
とk番目の認識候補文字のパターンとの類似度である。
【0007】総合判定部8は、上記各類似度算出部5,
6,7が算出した、各特徴についての入力文字パターン
と認識候補文字のパターンとの類似度S1(k),S2
(k),S3(k)から、下記の数式1に基づいて、入
力文字パターンと認識候補文字のパターンとの総合類似
度S(k)を、認識候補文字の一つひとつについて算出
する。上記S(k)は、入力文字パターンとk番目の認
識候補文字のパターンとの総合類似度である。
【0008】数式1. S(k)=W1*S1(k)+W2*S2(k)+W2
*S2(k) 上記数式1において、W1,W2,W3は、それぞれス
トローク特徴,方向特徴,特徴点分布特徴の各特徴につ
いての類似度に対する重みであり、重みの組{Wi}を
構成している。
【0009】即ち、総合判定部8は、各特徴についての
入力文字パターンと認識候補文字のパターンとの類似度
S1(k),S2(k),S3(k)に、それぞれ重み
W1,W2,W3を乗して和をとることにより、認識候
補文字の一つひとつについて総合類似度S(k)を算出
する。
【0010】そして総合判定部8は、算出した全ての認
識候補文字についての総合類似度S(k)のうち、最も
高い総合類似度となる認識候補文字を認識文字と判定し
て、その認識文字の文字コードを出力する。
【0011】上述のように、複数の特徴に基づいて文字
を認識することにより、一つひとつの特徴に基づく認識
の弱点を互いに補い、認識文字の正解率を向上させるこ
とができる。
【0012】
【発明が解決しようとする課題】上記各特徴についての
類似度に対する重みW1,W2,W3は、本来、文字パ
ターンの、かすれ,つぶれ,右上がりなどといった様々
な状況に応じて、それぞれ最適な値が存在するはずであ
る。
【0013】しかし、上記従来の文字認識装置では、そ
の重みW1,W2,W3は、ある固定した値に設定され
ていたため、文字パターンの状況によっては、文字を正
しく認識することが困難となる、つまり認識文字の正解
率が低下するという問題があった。
【0014】本発明は、この問題を解決するためになさ
れたもので、抽出する各特徴についての入力文字パター
ンと認識候補文字のパターンとの類似度に対する重み
を、文字パターンの状況に応じた最適な値に設定するこ
とにより、認識文字の正解率を高めた文字認識装置を提
供することを目的とする。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る文字認識装置では、総合判定部が正解
文字の文字コードとは別の誤った文字コードを出力した
場合に、操作者が正解文字の文字コードを入力すること
により、各類似度に対する重みの値を、正解文字の文字
コードに相当する認識候補文字が最も高い総合類似度と
なるような値に変更する重み変更部を設けた。
【0016】また、本発明に係る他の文字認識装置で
は、総合判定部が誤った文字コードを出力した場合に、
各類似度に対する重みの値を、操作者の指示に応じて設
定する重み設定部を設けた。
【0017】
【作用】上記重み変更部を設けることにより、総合判定
部が誤った文字コードを出力した場合に、各類似度に対
する重みの値を、文字パターンの状況に応じた最適な値
に変更することが可能となる。その結果、認識文字の正
解率を高めることができる。
【0018】また、重み設定部を設けることにより、文
字パターンを入力する前に、その文字パターンに最適な
重みの値を設定することが可能となる。その結果、文字
認識の開始時から、高い正解率を得ることができる。
【0019】
【実施例】以下、図面に基づいて本発明の実施例を説明
する。なお、実施例を示す図面中の構成要素のうち、図
6に示した従来例と相違ないものについては、従来例と
同一の符号を付して説明を省略する。また実施例の説明
中の記号は、従来例の場合と同じ意味で使用する。
【0020】実施例1.図1は、本発明の実施例1にお
ける文字認識装置のブロック構成図である。◎図のよう
に、この文字認識装置は、従来例と同様に入力文字パタ
ーンから抽出した三種類の特徴、例えばストローク特徴
と方向特徴と特徴点分布特徴とに基づいて文字を認識す
るように構成されたもので、従来例との相違は、重み変
更部9を付加した点にある。この重み変更部9は、総合
判定部8が総合類似度S(k)の算出に用いる、各特徴
についての類似度S1(k),S2(k),S3(k)
に対する重みW1,W2,W3の値を変更するものであ
る。
【0021】上記重み変更部9には、予め、複数組の重
みW1,W2,W3の値が記憶されている。これらの重
みの組{Wi}の値は、文書の文字パターンの、かす
れ,つぶれ,右上がりなどといった状況に応じて、それ
ぞれ最も高い正解率が得られるような最適の値に、実験
的あるいは経験的に設定される。例えば、図2の説明図
に示すように、標準的な状況の文字パターンに対する重
みの組{W(O)}として{W1=0.33,W2=
0.33,W3=0.33}、かすれの強い文字パター
ンに対する重みの組{W(A)}として{0.1,0.
45,0.45}、変形の強い文字パターンに対する重
みの組{W(B)}として{0.45,0.45,0.
1}が、それぞれ記憶されている。
【0022】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図1,図2および図3の流れ
図を用いて説明する。
【0023】予め、総合判定部8には、重みW1,W
2,W3の値として、重み変更部9に記憶させた複数の
重みの組{Wi}のうち、標準的な状況の文字パターン
に対する重みの組{W(O)}の値を設定しておく(ス
テップ1)。
【0024】そしていま、この文字認識装置に内蔵され
ている認識辞書の1番目の認識候補文字に相当する文字
パターンで、しかもかすれの強い文字パターンを、パタ
ーン入力部1に入力するとする(ステップ2)。
【0025】文字パターンを入力すると、従来例の場合
と同じように、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出する(ス
テップ3)。続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について、入
力文字パターンと、内蔵認識辞書の複数の認識候補文字
のパターンとの類似度S1(k),S2(k),S3
(k)を算出する(ステップ4)。
【0026】このとき算出された、各特徴についての入
力文字パターンと1番目の認識候補文字のパターンとの
類似度S1(1),S2(1),S3(1)、および2
番目の認識候補文字のパターンとの類似度S1(2),
S2(2),S3(2)がそれぞれ、 S1(1)=0.2,S2(1)=0.4,S3(1)
=0.6 S1(2)=0.6,S2(2)=0.3,S3(2)
=0.4 であったとする。この算出結果で、入力文字パターン
と、その入力文字パターンの正解文字である1番目の認
識候補文字のパターンとの、ストローク特徴についての
類似度S1(1)が小さい値となるのは、かすれの強い
入力文字パターンからストローク特徴を抽出することが
困難であるためである。
【0027】次いで、総合判定部8が、上記各類似度算
出部5,6,7による類似度算出結果に基づき、入力文
字パターンと認識候補文字のパターンとの総合類似度S
(k)を、従来例で示した数式1に従って、認識候補文
字の一つひとつについて算出する。そしてその総合類似
度S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ5)、その認識文字の文字コードを出力する
(ステップ6)。
【0028】ところで上記認識文字判定時の、入力文字
パターンと、その正解文字である1番目の認識候補文字
のパターンとの総合類似度S(1)、および2番目の認
識候補文字のパターンとの総合類似度S(2)はそれぞ
れ、現在設定されている重みの組{W(O)}の値が
{0.33,0.33,0.33}であることから、 S(1)=0.4 S(2)=0.433 となる。
【0029】即ち、正解文字である1番目の認識候補文
字のパターンとの総合類似度S(1)より、2番目の認
識候補文字のパターンとの類似度S(2)の方が大きな
値となる。その結果、総合判定部8は、2番目の認識候
補文字、あるいはその他の、最も高い総合類似度となる
認識候補文字を認識文字と判定してしまい、正解文字の
文字コードとは別の誤った文字コードを出力することに
なる。このように誤った文字コードを出力した原因は、
現在設定されている重みの組{W(i)}が、入力文字
パターンの状況に適していないことにある。
【0030】そこで、総合判定部8が誤った文字コード
を出力した場合には(ステップ7)、操作者が重み変更
部9に、正解文字の文字コードを入力する(ステップ
8)。
【0031】すると重み変更部9は、総合判定部8に設
定されている重みW1,W2,W3の値を、入力された
正解文字の文字コードに相当する認識候補文字が最も高
い総合類似度S(k)となるような値に変更する。つま
り重み変更部9は、総合判定部8に現在設定されている
重みの組{W(O)}を、重み変更部9が記憶してい
る、{W(O)}以外の重みの組{W(A)},{W
(B)}のうち、正解文字が最も高い総合類似度S
(k)となるような重みの組に変更する(ステップ
9)。
【0032】入力文字パターンと、正解文字である1番
目の認識候補文字のパターンとの総合類似度S(1)
を、かすれの強い文字パターンに対する重みの組{W
(A)}、および変形の強い文字パターンに対する重み
の組{W(B)}を用いて算出すると、それぞれ、 {W(A)}では、S(1)=0.47 {W(B)}では、S(1)=0.33 となる。よって、かすれの強い文字パターンに対する重
みの組{W(A)}に変更することになる。これは、入
力文字パターンがかすれの強い文字パターンであること
から、当然の結果である。
【0033】その後、総合判定部8は、正解文字の文字
コードを出力し直す(ステップ10)。その際、総合判
定部8に、正解文字の得られなかった入力文字パターン
について、変更された重みの組{W(A)}に基づく認
識文字の再判定を行わせる必要はなく、操作者が入力し
た正解文字の文字コードをそのまま出力させるようにす
ればよい。
【0034】これ以降の入力文字パターンについては、
総合判定部8が、変更された重みの組{W(A)}に基
づいて認識文字の判定を行い、その認識文字の文字コー
ドを出力する。そして総合判定部8が再び誤った文字コ
ードを出力するまで、上記ステップ2〜7を繰り返す。
【0035】上述のように、重み変更部9を付加したこ
の文字認識装置では、文字パターンの状況に応じて重み
の組{W(i)}を最適なものに変更することができる
ため、認識文字の正解率を高めることができる。しかも
総合判定部8が誤った文字コードを出力した場合に正解
文字の文字コードを入力するだけでよいため、操作が簡
単である。またこの文字認識装置が行うべき処理も単純
であるため、文字認識における高いスループットが得ら
れる。さらに重み変更部9には、文字パターンの数種類
の状況に対応した重みの組{W(i)}を記憶させる小
さな記憶領域を設ければよいため、この重み変更部9を
安価な部品で構成することができる。
【0036】なお、文字パターンのより多くの種類の状
況に対応させて、重みの組{W(i)}を重み変更部9
に記憶させておけば、それだけ認識文字の正解率を高め
ることができる。
【0037】また、上記文字認識装置では、抽出する入
力文字パターンの特徴を三種類としたが、より多くの種
類の特徴を抽出するように構成すれば、それだけ認識文
字の正解率を高めることができる。その場合には、各重
みの組{W(i)}を構成する重みの数も、抽出する特
徴の数と同じに増加させることになる。
【0038】実施例2.図4は、本発明の実施例2にお
ける文字認識装置のブロック構成図である。図のよう
に、この文字認識装置では、上記実施例1における重み
変更部9の代わりに、重み設定部10が設けられてい
る。その他の構成は、上記実施例1と同様である。
【0039】上記重み設定部10は、総合判定部8が総
合類似度S(k)の算出に用いる、各特徴についての類
似度S1(k),S2(k),S3(k)に対する重み
W1,W2,W3の値を、後述の如く操作者の指示に応
じて設定するものである。そしてこの重み設定部10に
は、上記実施例1における重み変更部9の場合と同じよ
うに、文書の文字パターンの種々の状況に適した複数の
重みの組{Wi}、例えば標準的な状況の文字パターン
に対する重みの組{W(O)}と、かすれの強い文字パ
ターンに対する重みの組{W(A)}と、変形の強い文
字パターンに対する重みの組{W(B)}とを予め記憶
させておく。
【0040】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図4および図5の流れ図を用
いて説明する。
【0041】先ず、文書の文字パターンを入力する前
に、操作者がその入力する文字パターンの状況を判断す
るとともに、重み設定部10に対し、その判断した状況
に最適な重みの組{Wi}を総合判定部8に設定するよ
うに指示する。その指示方法として、ここでは、重み設
定部10に文字パターンの状況を入力する(ステップ1
1)。なお、重み設定部10に対し、最適な重みの組
{Wi}そのものを指示するようにしてもよい。
【0042】すると重み設定部10が、記憶している複
数の重みの組{Wi}から、入力された文字パターンの
状況に最適な重みの組を選択して総合判定部8に設定す
る(ステップ12)。この状態で、文書の文字パターン
を、パターン入力部1に入力する(ステップ13)。
【0043】文字パターンを入力すると、上記実施例1
の場合と同様に、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出し(ステ
ップ14)、続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について類似
度S1(k),S2(k),S3(k)を算出する(ス
テップ15)。さらに総合判定部8が、その各類似度算
出部5,6,7による類似度算出結果に基づいて総合類
似度S(k)を、認識候補文字の一つひとつについて算
出する。そしてその総合類似度S(k)の算出結果に基
づいて認識文字の判定を行い(ステップ16)、その認
識文字の文字コードを出力する(ステップ17)。
【0044】このとき、総合判定部8が総合類似度S
(k)の算出に用いる重みの組{Wi}は、既に入力文
字パターンの状況に最適なものに設定されているため、
総合判定部8は非常に高い率で正解文字の文字コードを
出力することになる。
【0045】そして、入力する文字パターンの状況が変
化する場合には(ステップ18)、操作者が改めてその
入力する文字パターンの状況を重み設定部10に入力し
(ステップ11)、また入力する文字パターンの状況が
変化しなければ、文字認識装置が上記ステップ13〜1
8を繰り返し、次々と入力される文字パターンに対して
文字認識を行う。
【0046】上述のように、本実施例2における文字認
識装置の場合にも、入力文字パターンの状況に最適な重
みの組{W(i)}を、重み設定部10によって総合判
定部8に設定することができるため、上記実施例1にお
ける文字認識装置と同様に認識文字の正解率を高めるこ
とができる。しかも本実施例2における文字認識装置で
は、文字パターンを入力する前に、その文字パターンに
最適な重みの組{Wi}を設定することができるため、
文字認識の開始時から、高い正解率を得ることができ
る。その他、操作が簡単であるとともに、高いスループ
ットが得られ、さらに重み設定部10を安価な部品で構
成することができるといった利点があることも上記実施
例1の場合と同様である。
【0047】ところで、実際に入力する文字パターンの
状況には、予め想定した複数の状況が混在する場合があ
る。そこで上記実施例1における重み変更部9、あるい
は上記実施例2における重み設定部10に記憶されてい
る複数の重みの組に、適当なパラメータを乗して和をと
ることにより、新たな状況に適した重みの組を生成する
ように構成すれば、認識文字の正解率を一層高めること
ができる。例えば、記憶されている、かすれの強い文字
パターンに対する重みの組{W(A)}と、変形の強い
文字パターンに対する重みの組{W(B)}とから、
[Na*{W(A)}+Nb*{W(B)}]の計算に
よって(Na,Nbはパラメータ)、かすれと変形の強
い文字パターンに対する新たな重みの組を生成する。ま
たこのようにして新たな重みの組を生成させるようにす
れば、重み変更部9あるいは重み設定部10の記憶領域
を拡大する必要もない。
【0048】
【発明の効果】以上説明したとおり、重み変更部あるい
は重み設定部を設けた本発明に係る文字認識装置によれ
ば、高い正解率で文字を認識することができる。
【0049】また、重み設定部を設けた場合には、文字
パターンを入力する前に、その文字パターンに最適な重
みの値を設定することができるため、文字認識の最初か
ら、高い正解率を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施例1における文字認識装置のブロ
ック構成図である。
【図2】実施例1における重み変更部に記憶される重み
の組の説明図である。
【図3】実施例1における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
【図4】本発明の実施例2における文字認識装置のブロ
ック構成図である。
【図5】実施例2における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
【図6】従来の文字認識装置のブロック構成図である。
【符号の説明】
1 パターン入力部 2,3,4 特徴抽出部 5,6,7 類似度算出部 8 総合判定部 9 重み変更部 10 重み設定部
【手続補正書】
【提出日】平成4年12月28日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 文字認識装置
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書の文字を認識し、
その認識文字の文字コードをコンピュータ等へ出力する
文字認識装置、特に、文字のパターンから複数の特徴を
抽出し、その抽出した複数の特徴に基づいて文字を認識
する文字認識装置に関する。
【0002】
【従来の技術】文字のパターンから複数の特徴を抽出
し、その抽出した複数の特徴に基づいて文字を認識する
方法については、例えば「大局的特徴を併用したストロ
ークマッチング法による手書き漢字認識の検討」(電子
通信学会技術研究報告PRL82−30,1982年)
に報告されている。
【0003】図6は、上記文献に基づく従来の文字認識
装置のブロック構成図である。
【0004】図のようにこの文字認識装置は、パターン
入力部1と、第一,第二,第三の三つの特徴抽出部2,
3,4と、第一,第二,第三の三つの類似度算出部5,
6,7と、総合判定部8とから構成されている。
【0005】上記構成において、パターン入力部1に文
書の文字のパターンが入力されると、パターン入力部1
は、第一,第二,第三の各特徴抽出部2,3,4へその
入力文字パターンを出力する。すると各特徴抽出部2,
3,4は、その入力文字パターンからそれぞれ異なる三
種類の特徴、例えばストローク特徴と方向特徴と特徴点
分布特徴とを抽出し、その抽出したそれぞれの特徴の値
を、対応する第一,第二,第三の各類似度算出部5,
6,7へ出力する。
【0006】各類似度算出部5,6,7は、各特徴抽出
部2,3,4で抽出されたそれぞれの特徴について、入
力文字パターンと、この文字認識装置に内蔵されている
認識辞書の複数の認識候補文字のパターンとの類似度S
1(k),S2(k),S3(k)を算出し、その算出
結果を総合判定部8へ出力する。上記S1(k),S2
(k),S3(k)は、例えばそれぞれストローク特徴
と方向特徴と特徴点分布特徴とについての、入力文字パ
ターンとk番目の認識候補文字のパターンとの類似度で
ある。
【0007】総合判定部8は、上記各類似度算出部5,
6,7が算出した、各特徴についての入力文字パターン
と認識候補文字のパターンとの類似度S1(k),S2
(k),S3(k)から、下記の数式1に基づいて、入
力文字パターンと認識候補文字のパターンとの総合類似
度S(k)を、認識候補文字の一つひとつについて算出
する。上記S(k)は、入力文字パターンとk番目の認
識候補文字のパターンとの総合類似度である。
【0008】数式1. S(k)=W1*S1(k)+W2*S2(k)+W2
*S2(k) 上記数式1において、W1,W2,W3は、例えばそれ
ぞれストローク特徴,方向特徴,特徴点分布特徴の各特
徴についての類似度に対する重みであり、重みの組{W
i}を構成している。
【0009】即ち、総合判定部8は、各特徴についての
入力文字パターンと認識候補文字のパターンとの類似度
S1(k),S2(k),S3(k)に、それぞれ重み
W1,W2,W3を乗して和をとることにより、認識候
補文字の一つひとつについて総合類似度S(k)を算出
する。
【0010】そして総合判定部8は、算出した全ての認
識候補文字についての総合類似度S(k)のうち、最も
高い総合類似度となる認識候補文字を認識文字と判定し
て、その認識文字の文字コードを出力する。
【0011】上述のように、複数の特徴に基づいて文字
を認識することにより、一つひとつの特徴に基づく認識
の弱点を互いに補い、認識文字の正解率を向上させるこ
とができる。
【0012】
【発明が解決しようとする課題】上記各特徴についての
類似度に対する重みW1,W2,W3は、本来、文字パ
ターンの、かすれ,つぶれ,右上がりなどといった様々
な状況に応じて、それぞれ最適な値が存在するはずであ
る。
【0013】しかし、上記従来の文字認識装置では、そ
の重みW1,W2,W3は、ある固定した値に設定され
ていたため、文字パターンの状況によっては、文字を正
しく認識することが困難となる、つまり認識文字の正解
率が低下するという問題があった。
【0014】本発明は、この問題を解決するためになさ
れたもので、抽出する各特徴についての入力文字パター
ンと認識候補文字のパターンとの類似度に対する重み
を、文字パターンの状況に応じた最適な値に設定するこ
とにより、認識文字の正解率を高めた文字認識装置を提
供することを目的とする。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る文字認識装置では、上記入力文字パタ
ーンの状況に応じて設定する重み最適化部を設けた。
【0016】また、本発明にかかる他の文字認識装置で
は、総合判定部が正解文字の文字コードとは別の誤った
文字コードを出力した場合に、操作者が正解文字の文字
コードを入力することにより、各類似度に対する重みの
値を、正解文字の文字コードに相当する認識候補文字が
最も高い総合類似度となるような値に変更する重み変更
部を設けた。
【0017】さらに、本発明に係る他の文字認識装置で
、各類似度に対する重みの値を、操作者の指示に応じ
て設定する重み設定部を設けた。
【0018】さらに、本発明にかかる他の文字認識装置
では、文字パターンの各状況に対してそれぞれ最適化さ
れた重みを記憶する手段と、文字パターンの入力時に当
該文字パターンの状況を入力する状況入力手段と、前記
記憶された複数個の重みから前記入力された文字パター
ンの状況に基づきて新たな重みを算出する重み合成部と
を設けた。
【0019】
【作用】上記重み最適化部を設けることにより、入力さ
れた文字パターンの各状況に対して最適な重み付けが行
われ、この結果文字認識の高い正解率を得ることができ
る。
【0020】上記重み変更部を設けることにより、総合
判定部が誤った文字コードを出力した場合に、各類似度
に対する重みの値を、文字パターンの状況に応じた最適
な値に変更することが可能となる。その結果、認識文字
の正解率を高めることができる。
【0021】また、重み設定部を設けることにより、文
字パターンを入力する前に、その文字パターンに最適な
重みの値を設定することが可能となる。その結果、文字
認識の開始時から、高い正解率を得ることができる。
【0022】また、上記重み合成部を設けることによ
り、予め想定された文字パターンの状況のうちの複数の
状況が混在する場合に、個々の状況に応じて設定された
重みの値に基づき新たな重みの値を合成することができ
る。この結果、複数の状況が混在する場合に独立した重
みの値を設定する必要がなくなる。
【0023】また、上記重み合成部を設けることによ
り、予め想定された文字パターンの状況のうちの複数の
状況が混在する場合に、個々の状況に応じて設定された
重みの値に基づき新たな重みの値を合成することができ
る。この結果、複数の状況が混在する場合に独立した重
みの値を設定する必要がなくなる。
【0024】
【実施例】以下、図面に基づいて本発明の実施例を説明
する
【0025】なお、実施例を示す図面中の構成要素のう
ち、図6に示した従来例と相違ないものについては、従
来例と同一の符号を付して説明を省略する。また実施例
の説明中の記号は、従来例の場合と同じ意味で使用す
る。
【0026】実施例1.図1は、本発明の実施例1にお
ける文字認識装置のブロック構成図である。
【0027】図のように、この文字認識装置は、従来例
と同様に入力文字パターンから抽出した三種類の特徴、
例えばストローク特徴と方向特徴と特徴点分布特徴とに
基づいて文字を認識するように構成されたもので、従来
例との相違は、重み変更部9を付加した点にある。この
重み変更部9は、総合判定部8が総合類似度S(k)の
算出に用いる、各特徴についての類似度S1(k),S
2(k),S3(k)に対する重みW1,W2,W3の
値を変更するものである。
【0028】上記重み変更部9には、予め、複数組の重
みW1,W2,W3の値が記憶されている。これらの重
みの組{Wi}の値は、文書の文字パターンの、かす
れ,つぶれ,右上がりなどといった状況に応じて、それ
ぞれ最も高い正解率が得られるような最適の値に、実験
的あるいは経験的に設定される。例えば、図2の説明図
に示すように、標準的な状況の文字パターンに対する重
みの組{W(O)}として{W1=0.33,W2=
0.33,W3=0.33}、かすれの強い文字パター
ンに対する重みの組{W(A)}として{0.1,0.
45,0.45}、変形の強い文字パターンに対する重
みの組{W(B)}として{0.45,0.45,0.
1}が、それぞれ記憶されている。
【0029】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図1,図2および図3の流れ
図を用いて説明する。
【0030】予め、総合判定部8には、重みW1,W
2,W3の値として、重み変更部9に記憶させた複数の
重みの組{Wi}のうち、標準的な状況の文字パターン
に対する重みの組{W(O)}の値を設定しておく(ス
テップ1)。
【0031】そしていま、この文字認識装置に内蔵され
ている認識辞書の1番目の認識候補文字に相当する文字
パターンで、しかもかすれの強い文字パターンを、パタ
ーン入力部1に入力するとする(ステップ2)。
【0032】文字パターンを入力すると、従来例の場合
と同じように、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出する(ス
テップ3)。続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について、入
力文字パターンと、内蔵認識辞書の複数の認識候補文字
のパターンとの類似度S1(k),S2(k),S3
(k)を算出する(ステップ4)。
【0033】このとき算出された、各特徴についての入
力文字パターンと1番目の認識候補文字のパターンとの
類似度S1(1),S2(1),S3(1)、および2
番目の認識候補文字のパターンとの類似度S1(2),
S2(2),S3(2)がそれぞれ、 S1(1)=0.2,S2(1)=0.4,S3(1)
=0.6 S1(2)=0.6,S2(2)=0.3,S3(2)
=0.4 であったとする。この算出結果で、入力文字パターン
と、その入力文字パターンの正解文字である1番目の認
識候補文字のパターンとの、ストローク特徴についての
類似度S1(1)が小さい値となるのは、かすれの強い
入力文字パターンからストローク特徴を抽出することが
困難であるためである。
【0034】次いで、総合判定部8が、上記各類似度算
出部5,6,7による類似度算出結果に基づき、入力文
字パターンと認識候補文字のパターンとの総合類似度S
(k)を、従来例で示した数式1に従って、認識候補文
字の一つひとつについて算出する。そしてその総合類似
度S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ5)、その認識文字の文字コードを出力する
(ステップ6)。
【0035】ところで上記認識文字判定時の、入力文字
パターンと、その正解文字である1番目の認識候補文字
のパターンとの総合類似度S(1)、および2番目の認
識候補文字のパターンとの総合類似度S(2)はそれぞ
れ、現在設定されている重みの組{W(O)}の値が
{0.33,0.33,0.33}であることから、 S(1)=0.4 S(2)=0.433 となる。
【0036】即ち、正解文字である1番目の認識候補文
字のパターンとの総合類似度S(1)より、2番目の認
識候補文字のパターンとの類似度S(2)の方が大きな
値となる。その結果、総合判定部8は、2番目の認識候
補文字、あるいはその他の、最も高い総合類似度となる
認識候補文字を認識文字と判定してしまい、正解文字の
文字コードとは別の誤った文字コードを出力することに
なる。このように誤った文字コードを出力した原因は、
現在設定されている重みの組{W(i)}が、入力文字
パターンの状況に適していないことにある。
【0037】そこで、総合判定部8が誤った文字コード
を出力した場合には(ステップ7)、操作者が重み変更
部9に、正解文字の文字コードを入力する(ステップ
8)。
【0038】すると重み変更部9は、総合判定部8に設
定されている重みW1,W2,W3の値を、入力された
正解文字の文字コードに相当する認識候補文字が最も高
い総合類似度S(k)となるような値に変更する。つま
り重み変更部9は、総合判定部8に現在設定されている
重みの組{W(O)}を、重み変更部9が記憶してい
る、{W(O)}以外の重みの組{W(A)},{W
(B)}のうち、正解文字が最も高い総合類似度S
(k)となるような重みの組に変更する(ステップ
9)。
【0039】入力文字パターンと、正解文字である1番
目の認識候補文字のパターンとの総合類似度S(1)
を、かすれの強い文字パターンに対する重みの組{W
(A)}、および変形の強い文字パターンに対する重み
の組{W(B)}を用いて算出すると、それぞれ、 {W(A)}では、S(1)=0.47 {W(B)}では、S(1)=0.33 となる。よって、かすれの強い文字パターンに対する重
みの組{W(A)}に変更することになる。これは、入
力文字パターンがかすれの強い文字パターンであること
から、当然の結果である。
【0040】その後、総合判定部8は、正解文字の文字
コードを出力し直す(ステップ10)。その際、総合判
定部8に、正解文字の得られなかった入力文字パターン
について、変更された重みの組{W(A)}に基づく認
識文字の再判定を行わせる必要はなく、操作者が入力し
た正解文字の文字コードをそのまま出力させるようにす
ればよい。
【0041】これ以降の入力文字パターンについては、
総合判定部8が、変更された重みの組{W(A)}に基
づいて認識文字の判定を行い、その認識文字の文字コー
ドを出力する。そして総合判定部8が再び誤った文字コ
ードを出力するまで、上記ステップ2〜7を繰り返す。
【0042】上述のように、重み変更部9を付加したこ
の文字認識装置では、文字パターンの状況に応じて重み
の組{W(i)}を最適なものに変更することができる
ため、認識文字の正解率を高めることができる。しかも
総合判定部8が誤った文字コードを出力した場合に正解
文字の文字コードを入力するだけでよいため、操作が簡
単である。またこの文字認識装置が行うべき処理も単純
であるため、文字認識における高いスループットが得ら
れる。さらに重み変更部9には、文字パターンの数種類
の状況に対応した重みの組{W(i)}を記憶させる小
さな記憶領域を設ければよいため、この重み変更部9を
安価な部品で構成することができる。
【0043】なお、文字パターンのより多くの種類の状
況に対応させて、重みの組{W(i)}を重み変更部9
に記憶させておけば、それだけ認識文字の正解率を高め
ることができる。
【0044】また、上記文字認識装置では、抽出する入
力文字パターンの特徴を三種類としたが、より多くの種
類の特徴を抽出するように構成すれば、それだけ認識文
字の正解率を高めることができる。その場合には、各重
みの組{W(i)}を構成する重みの数も、抽出する特
徴の数と同じに増加させることになる。
【0045】実施例2.図4は、本発明の実施例2にお
ける文字認識装置のブロック構成図である。
【0046】図のように、この文字認識装置では、上記
実施例1における重み変更部9の代わりに、重み設定部
10が設けられている。その他の構成は、上記実施例1
と同様である。
【0047】上記重み設定部10は、総合判定部8が総
合類似度S(k)の算出に用いる、各特徴についての類
似度S1(k),S2(k),S3(k)に対する重み
W1,W2,W3の値を、後述の如く操作者の指示に応
じて設定するものである。そしてこの重み設定部10に
は、上記実施例1における重み変更部9の場合と同じよ
うに、文書の文字パターンの種々の状況に適した複数の
重みの組{Wi}、例えば標準的な状況の文字パターン
に対する重みの組{W(O)}と、かすれの強い文字パ
ターンに対する重みの組{W(A)}と、変形の強い文
字パターンに対する重みの組{W(B)}とを予め記憶
させておく。
【0048】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図4および図5の流れ図を用
いて説明する。
【0049】先ず、文書の文字パターンを入力する前
に、操作者がその入力する文字パターンの状況を判断す
るとともに、重み設定部10に対し、その判断した状況
に最適な重みの組{Wi}を総合判定部8に設定するよ
うに指示する。その指示方法として、ここでは、重み設
定部10に文字パターンの状況を入力する(ステップ1
1)。なお、重み設定部10に対し、最適な重みの組
{Wi}そのものを指示するようにしてもよい。
【0050】すると重み設定部10が、記憶している複
数の重みの組{Wi}から、入力された文字パターンの
状況に最適な重みの組を選択して総合判定部8に設定す
る(ステップ12)。この状態で、文書の文字パターン
を、パターン入力部1に入力する(ステップ13)。
【0051】文字パターンを入力すると、上記実施例1
の場合と同様に、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出し(ステ
ップ14)、続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について類似
度S1(k),S2(k),S3(k)を算出する(ス
テップ15)。さらに総合判定部8が、その各類似度算
出部5,6,7による類似度算出結果に基づいて総合類
似度S(k)を、認識候補文字の一つひとつについて算
出する。そしてその総合類似度S(k)の算出結果に基
づいて認識文字の判定を行い(ステップ16)、その認
識文字の文字コードを出力する(ステップ17)。
【0052】このとき、総合判定部8が総合類似度S
(k)の算出に用いる重みの組{Wi}は、既に入力文
字パターンの状況に最適なものに設定されているため、
総合判定部8は非常に高い率で正解文字の文字コードを
出力することになる。
【0053】そして、入力する文字パターンの状況が変
化する場合には(ステップ18)、操作者が改めてその
入力する文字パターンの状況を重み設定部10に入力し
(ステップ11)、また入力する文字パターンの状況が
変化しなければ、文字認識装置が上記ステップ13〜1
8を繰り返し、次々と入力される文字パターンに対して
文字認識を行う。
【0054】上述のように、本実施例2における文字認
識装置の場合にも、入力文字パターンの状況に最適な重
みの組{W(i)}を、重み設定部10によって総合判
定部8に設定することができるため、上記実施例1にお
ける文字認識装置と同様に認識文字の正解率を高めるこ
とができる。しかも本実施例2における文字認識装置で
は、文字パターンを入力する前に、その文字パターンに
最適な重みの組{Wi}を設定することができるため、
文字認識の開始時から、高い正解率を得ることができ
る。その他、操作が簡単であるとともに、高いスループ
ットが得られ、さらに重み設定部10を安価な部品で構
成することができるといった利点があることも上記実施
例1の場合と同様である。
【0055】ところで、実際に入力する文字パターンの
状況には、予め想定した複数の状況が混在する場合があ
る。そこで上記実施例1における重み変更部9、あるい
は上記実施例2における重み設定部10に記憶されてい
る複数の重みの組に、適当なパラメータを乗して和をと
ることにより、新たな状況に適した重みの組を生成する
ように構成すれば、認識文字の正解率を一層高めること
ができる。例えば、記憶されている、かすれの強い文字
パターンに対する重みの組{W(A)}と、変形の強い
文字パターンに対する重みの組{W(B)}とから、
[Na*{W(A)}+Nb*{W(B)}]の計算に
よって(Na,Nbはパラメータ)、かすれと変形の強
い文字パターンに対する新たな重みの組を生成する。ま
たこのようにして新たな重みの組を生成させるようにす
れば、重み変更部9あるいは重み設定部10の記憶領域
を拡大する必要もない。
【0056】
【発明の効果】以上説明したとおり、重み最適化部ある
いは重み変更部あるいは重み設定部あるいは重み合成部
を設けた本発明に係る文字認識装置によれば、高い正解
率で文字を認識することができる。
【0057】また、重み設定部を設けた場合には、文字
パターンを入力する前に、その文字パターンに最適な重
みの値を設定することができるため、文字認識の最初か
ら、高い正解率を得ることができる。
【0058】また、重み合成部を設けた場合には、実際
の文字パターンの状況が予め設定された文字パターンの
状況のいくつかが重なったような場合においても、適切
な重み付けをすることができる。そして、実際の文字パ
ターンの状況を予め設定されたパターン状況の組み合わ
せとして表すことにより、予め設定するパターン状況の
種類を少なくすることができる。
【図面の簡単な説明】
【図1】本発明の実施例1における文字認識装置のブロ
ック構成図である。
【図2】実施例1における重み変更部に記憶される重み
の組の説明図である。
【図3】実施例1における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
【図4】本発明の実施例2における文字認識装置のブロ
ック構成図である。
【図5】実施例2における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
【図6】従来の文字認識装置のブロック構成図である。
【符号の説明】 1 パターン入力部 2,3,4 特徴抽出部 5,6,7 類似度算出部 8 総合判定部 9 重み変更部 10 重み設定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字のパターンが入力されるパターン入
    力部と、 上記パターン入力部に入力された文字パターンから複数
    の特徴を抽出する複数の特徴抽出部と、 上記各特徴抽出部で抽出されたそれぞれの特徴につい
    て、上記入力文字パターンと内蔵認識辞書の認識候補文
    字のパターンとの類似度を算出する複数の類似度算出部
    と、 上記各類似度算出部で算出された各特徴についての類似
    度に、その各類似度に対する重みを乗して和をとること
    により、上記入力文字パターンと認識候補文字のパター
    ンとの総合類似度を一つひとつの認識候補文字について
    算出し、最も高い総合類似度となる認識候補文字を認識
    文字と判定してその認識文字の文字コードを出力する総
    合判定部と、 を備えた文字認識装置において、 上記総合判定部が正解文字の文字コードとは別の誤った
    文字コードを出力した場合に、操作者が正解文字の文字
    コードを入力することにより、上記各類似度に対する重
    みの値を、正解文字の文字コードに相当する認識候補文
    字が最も高い総合類似度となるような値に変更する重み
    変更部を設けたことを特徴とする文字認識装置。
  2. 【請求項2】 文字のパターンが入力されるパターン入
    力部と、 上記パターン入力部に入力された文字パターンから複数
    の特徴を抽出する複数の特徴抽出部と、 上記各特徴抽出部で抽出されたそれぞれの特徴につい
    て、上記入力文字パターンと内蔵認識辞書の多数の認識
    候補文字のパターンとの類似度を算出する複数の類似度
    算出部と、 上記各類似度算出部で算出された各特徴についての類似
    度に、その各類似度に対する重みを乗して和をとること
    により、上記入力文字パターンと認識候補文字のパター
    ンとの総合類似度を一つひとつの認識候補文字について
    算出し、最も高い総合類似度となる認識候補文字を認識
    文字と判定してその認識文字の文字コードを出力する総
    合判定部と、 を備えた文字認識装置において、 上記各類似度に対する重みの値を、操作者の指示に応じ
    て設定する重み設定部を設けたことを特徴とする文字認
    識装置。
JP04114904A 1992-05-07 1992-05-07 文字認識装置 Expired - Fee Related JP3110552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04114904A JP3110552B2 (ja) 1992-05-07 1992-05-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04114904A JP3110552B2 (ja) 1992-05-07 1992-05-07 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05314317A true JPH05314317A (ja) 1993-11-26
JP3110552B2 JP3110552B2 (ja) 2000-11-20

Family

ID=14649542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04114904A Expired - Fee Related JP3110552B2 (ja) 1992-05-07 1992-05-07 文字認識装置

Country Status (1)

Country Link
JP (1) JP3110552B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置
JP2002189983A (ja) * 2000-12-21 2002-07-05 Toshiba Corp 文字認識装置と配達物処理装置
JP2013200796A (ja) * 2012-03-26 2013-10-03 Fuji Xerox Co Ltd 文字認識学習装置、文字認識装置、およびプログラム
CN103714332A (zh) * 2012-10-01 2014-04-09 富士施乐株式会社 字符识别设备和字符识别方法
US10112203B2 (en) 2013-04-17 2018-10-30 S.C. Johnson & Son, Inc. Portable volatile material dispenser and method of simulating a flame in same

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置
JP2002189983A (ja) * 2000-12-21 2002-07-05 Toshiba Corp 文字認識装置と配達物処理装置
JP2013200796A (ja) * 2012-03-26 2013-10-03 Fuji Xerox Co Ltd 文字認識学習装置、文字認識装置、およびプログラム
CN103714332A (zh) * 2012-10-01 2014-04-09 富士施乐株式会社 字符识别设备和字符识别方法
JP2014071813A (ja) * 2012-10-01 2014-04-21 Fuji Xerox Co Ltd 文字認識装置及びプログラム
US10112203B2 (en) 2013-04-17 2018-10-30 S.C. Johnson & Son, Inc. Portable volatile material dispenser and method of simulating a flame in same

Also Published As

Publication number Publication date
JP3110552B2 (ja) 2000-11-20

Similar Documents

Publication Publication Date Title
US6081620A (en) System and method for pattern recognition
JP3155616B2 (ja) 文字認識方法及び装置
JP2003051010A (ja) イメージ群選別方法
JPH05314317A (ja) 文字認識装置
EP0471472A2 (en) Image processing method and apparatus therefor
JP3319203B2 (ja) 文書ファイリング方法及び装置
US5787202A (en) Character recognition apparatus
JPH0485660A (ja) 入力誤り自動訂正装置
JPH07271916A (ja) 学習パターン生成装置及びこれを用いた文字認識装置
JP2894305B2 (ja) 認識装置の候補修正方式
JP3249654B2 (ja) 活字文字認識用辞書の作成方法
JP3037727B2 (ja) Ocrシステム
JP2874815B2 (ja) 日本語文字読取装置
AU2216897A (en) Method and device for handwritten character recognition
JP3320083B2 (ja) 文字認識装置及び方法
JP3486246B2 (ja) 文字認識装置
JP2687902B2 (ja) 文書画像認識装置
JPH076201A (ja) 文字認識パラメータ制御方法
JP2740506B2 (ja) 画像認識方法
JPH05120472A (ja) 文字認識装置
JPH01292587A (ja) 画像処理方法
JP2002279343A (ja) 認識結果修正装置、認識結果修正方法および記録媒体
JPH04299776A (ja) 図形処理システム
JPH0520492A (ja) 文書認識修正装置
JPH103515A (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees