JP3110552B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3110552B2 JP3110552B2 JP04114904A JP11490492A JP3110552B2 JP 3110552 B2 JP3110552 B2 JP 3110552B2 JP 04114904 A JP04114904 A JP 04114904A JP 11490492 A JP11490492 A JP 11490492A JP 3110552 B2 JP3110552 B2 JP 3110552B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- similarity
- input
- weights
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文書の文字を認識し、
その認識文字の文字コードをコンピュータ等へ出力する
文字認識装置、特に、文字のパターンから複数の特徴を
抽出し、その抽出した複数の特徴に基づいて文字を認識
する文字認識装置に関する。
その認識文字の文字コードをコンピュータ等へ出力する
文字認識装置、特に、文字のパターンから複数の特徴を
抽出し、その抽出した複数の特徴に基づいて文字を認識
する文字認識装置に関する。
【0002】
【従来の技術】文字のパターンから複数の特徴を抽出
し、その抽出した複数の特徴に基づいて文字を認識する
方法については、例えば「大局的特徴を併用したストロ
ークマッチング法による手書き漢字認識の検討」(電子
通信学会技術研究報告PRL82−30,1982年)
に報告されている。
し、その抽出した複数の特徴に基づいて文字を認識する
方法については、例えば「大局的特徴を併用したストロ
ークマッチング法による手書き漢字認識の検討」(電子
通信学会技術研究報告PRL82−30,1982年)
に報告されている。
【0003】図6は、上記文献に基づく従来の文字認識
装置のブロック構成図である。
装置のブロック構成図である。
【0004】図のようにこの文字認識装置は、パターン
入力部1と、第一,第二,第三の三つの特徴抽出部2,
3,4と、第一,第二,第三の三つの類似度算出部5,
6,7と、総合判定部8とから構成されている。
入力部1と、第一,第二,第三の三つの特徴抽出部2,
3,4と、第一,第二,第三の三つの類似度算出部5,
6,7と、総合判定部8とから構成されている。
【0005】上記構成において、パターン入力部1に文
書の文字のパターンが入力されると、パターン入力部1
は、第一,第二,第三の各特徴抽出部2,3,4へその
入力文字パターンを出力する。すると各特徴抽出部2,
3,4は、その入力文字パターンからそれぞれ異なる三
種類の特徴、例えばストローク特徴と方向特徴と特徴点
分布特徴とを抽出し、その抽出したそれぞれの特徴の値
を、対応する第一,第二,第三の各類似度算出部5,
6,7へ出力する。
書の文字のパターンが入力されると、パターン入力部1
は、第一,第二,第三の各特徴抽出部2,3,4へその
入力文字パターンを出力する。すると各特徴抽出部2,
3,4は、その入力文字パターンからそれぞれ異なる三
種類の特徴、例えばストローク特徴と方向特徴と特徴点
分布特徴とを抽出し、その抽出したそれぞれの特徴の値
を、対応する第一,第二,第三の各類似度算出部5,
6,7へ出力する。
【0006】各類似度算出部5,6,7は、各特徴抽出
部2,3,4で抽出されたそれぞれの特徴について、入
力文字パターンと、この文字認識装置に内蔵されている
認識辞書の複数の認識候補文字のパターンとの類似度S
1(k),S2(k),S3(k)を算出し、その算出
結果を総合判定部8へ出力する。上記S1(k),S2
(k),S3(k)は、例えばそれぞれストローク特徴
と方向特徴と特徴点分布特徴とについての、入力文字パ
ターンとk番目の認識候補文字のパターンとの類似度で
ある。
部2,3,4で抽出されたそれぞれの特徴について、入
力文字パターンと、この文字認識装置に内蔵されている
認識辞書の複数の認識候補文字のパターンとの類似度S
1(k),S2(k),S3(k)を算出し、その算出
結果を総合判定部8へ出力する。上記S1(k),S2
(k),S3(k)は、例えばそれぞれストローク特徴
と方向特徴と特徴点分布特徴とについての、入力文字パ
ターンとk番目の認識候補文字のパターンとの類似度で
ある。
【0007】総合判定部8は、上記各類似度算出部5,
6,7が算出した、各特徴についての入力文字パターン
と認識候補文字のパターンとの類似度S1(k),S2
(k),S3(k)から、下記の数式1に基づいて、入
力文字パターンと認識候補文字のパターンとの総合類似
度S(k)を、認識候補文字の一つひとつについて算出
する。上記S(k)は、入力文字パターンとk番目の認
識候補文字のパターンとの総合類似度である。
6,7が算出した、各特徴についての入力文字パターン
と認識候補文字のパターンとの類似度S1(k),S2
(k),S3(k)から、下記の数式1に基づいて、入
力文字パターンと認識候補文字のパターンとの総合類似
度S(k)を、認識候補文字の一つひとつについて算出
する。上記S(k)は、入力文字パターンとk番目の認
識候補文字のパターンとの総合類似度である。
【0008】数式1. S(k)=W1*S1(k)+W2*S2(k)+W3
*S3(k) 上記数式1において、W1,W2,W3は、例えばそれ
ぞれストローク特徴,方向特徴,特徴点分布特徴の各特
徴についての類似度に対する重みであり、重みの組{W
i}を構成している。
*S3(k) 上記数式1において、W1,W2,W3は、例えばそれ
ぞれストローク特徴,方向特徴,特徴点分布特徴の各特
徴についての類似度に対する重みであり、重みの組{W
i}を構成している。
【0009】即ち、総合判定部8は、各特徴についての
入力文字パターンと認識候補文字のパターンとの類似度
S1(k),S2(k),S3(k)に、それぞれ重み
W1,W2,W3を乗して和をとることにより、認識候
補文字の一つひとつについて総合類似度S(k)を算出
する。
入力文字パターンと認識候補文字のパターンとの類似度
S1(k),S2(k),S3(k)に、それぞれ重み
W1,W2,W3を乗して和をとることにより、認識候
補文字の一つひとつについて総合類似度S(k)を算出
する。
【0010】そして総合判定部8は、算出した全ての認
識候補文字についての総合類似度S(k)のうち、最も
高い総合類似度となる認識候補文字を認識文字と判定し
て、その認識文字の文字コードを出力する。
識候補文字についての総合類似度S(k)のうち、最も
高い総合類似度となる認識候補文字を認識文字と判定し
て、その認識文字の文字コードを出力する。
【0011】上述のように、複数の特徴に基づいて文字
を認識することにより、一つひとつの特徴に基づく認識
の弱点を互いに補い、認識文字の正解率を向上させるこ
とができる。
を認識することにより、一つひとつの特徴に基づく認識
の弱点を互いに補い、認識文字の正解率を向上させるこ
とができる。
【0012】
【発明が解決しようとする課題】上記各特徴についての
類似度に対する重みW1,W2,W3は、本来、文字パ
ターンの、かすれ,つぶれ,右上がりなどといった様々
な状況に応じて、それぞれ最適な値が存在するはずであ
る。
類似度に対する重みW1,W2,W3は、本来、文字パ
ターンの、かすれ,つぶれ,右上がりなどといった様々
な状況に応じて、それぞれ最適な値が存在するはずであ
る。
【0013】しかし、上記従来の文字認識装置では、そ
の重みW1,W2,W3は、ある固定した値に設定され
ていたため、文字パターンの状況によっては、文字を正
しく認識することが困難となる、つまり認識文字の正解
率が低下するという問題があった。
の重みW1,W2,W3は、ある固定した値に設定され
ていたため、文字パターンの状況によっては、文字を正
しく認識することが困難となる、つまり認識文字の正解
率が低下するという問題があった。
【0014】本発明は、この問題を解決するためになさ
れたもので、抽出する各特徴についての入力文字パター
ンと認識候補文字のパターンとの類似度に対する重み
を、文字パターンの状況に応じた最適な値に設定するこ
とにより、認識文字の正解率を高めた文字認識装置を提
供することを目的とする。
れたもので、抽出する各特徴についての入力文字パター
ンと認識候補文字のパターンとの類似度に対する重み
を、文字パターンの状況に応じた最適な値に設定するこ
とにより、認識文字の正解率を高めた文字認識装置を提
供することを目的とする。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る文字認識装置では、各類似度に対する
重みの値を、操作者の指示に応じて設定するようにし
た。具体的には、あらかじめ各類似度に対する重みを、
文字パターンの状況に対応して複数組記憶しておく。実
際の文字認識において、操作者が、文字認識の対象とな
る文字パターンの状況を判断し、これを入力する。この
入力に基づき、前記記憶されている重みの組から適切な
重みの組が選択される。
に、本発明に係る文字認識装置では、各類似度に対する
重みの値を、操作者の指示に応じて設定するようにし
た。具体的には、あらかじめ各類似度に対する重みを、
文字パターンの状況に対応して複数組記憶しておく。実
際の文字認識において、操作者が、文字認識の対象とな
る文字パターンの状況を判断し、これを入力する。この
入力に基づき、前記記憶されている重みの組から適切な
重みの組が選択される。
【0016】また、操作者が入力される文字パターンに
応じて重みの組を直接指示することもできる。
応じて重みの組を直接指示することもできる。
【0017】また、本発明にかかる他の文字認識装置で
は、操作者が、認識対象となる文字パターンに関し、複
数の典型的な文字パターンのそれぞれ程度を判定し、こ
れに基づき重みの組を新たに算出するようにした。具体
的には、あらかじめ、複数の典型的な文字パターンに関
する各類似度に対する重みの組を算出する。次に、操作
者は、文字認識対象となる文字パターンについて、典型
的な文字パターンの程度を判定し、これを入力する。こ
の典型的な文字パターンの程度に基づき、それぞれに定
められた重みの組から新たな重みの組を算出する。
は、操作者が、認識対象となる文字パターンに関し、複
数の典型的な文字パターンのそれぞれ程度を判定し、こ
れに基づき重みの組を新たに算出するようにした。具体
的には、あらかじめ、複数の典型的な文字パターンに関
する各類似度に対する重みの組を算出する。次に、操作
者は、文字認識対象となる文字パターンについて、典型
的な文字パターンの程度を判定し、これを入力する。こ
の典型的な文字パターンの程度に基づき、それぞれに定
められた重みの組から新たな重みの組を算出する。
【0018】
【0019】
【作用】上記認識対象となる文字パターンに応じた重み
の組を適用することにより、文字認識の高い正解率を得
ることができる。
の組を適用することにより、文字認識の高い正解率を得
ることができる。
【0020】また、文字パターンを入力する前に、その
文字パターンに最適な重みの値を設定することが可能と
なる。その結果、文字認識の開始時から、高い正解率を
得ることができる。
文字パターンに最適な重みの値を設定することが可能と
なる。その結果、文字認識の開始時から、高い正解率を
得ることができる。
【0021】また、典型的な文字パターンの状況が混在
する場合に、個々の状況に応じて設定された重みの値に
基づき新たな重みの値を合成することができる。この結
果、複数の状況が混在する場合に独立した重みの値を設
定する必要がなくなる。
する場合に、個々の状況に応じて設定された重みの値に
基づき新たな重みの値を合成することができる。この結
果、複数の状況が混在する場合に独立した重みの値を設
定する必要がなくなる。
【0022】
【0023】
【0024】
【実施例】以下、図面に基づいて本発明の実施例を説明
する。
する。
【0025】なお、実施例を示す図面中の構成要素のう
ち、図6に示した従来例と相違ないものについては、従
来例と同一の符号を付して説明を省略する。また実施例
の説明中の記号は、従来例の場合と同じ意味で使用す
る。
ち、図6に示した従来例と相違ないものについては、従
来例と同一の符号を付して説明を省略する。また実施例
の説明中の記号は、従来例の場合と同じ意味で使用す
る。
【0026】関連技術 図1は、本発明の関連技術における文字認識装置のブロ
ック構成図である。
ック構成図である。
【0027】図のように、この文字認識装置は、従来例
と同様に入力文字パターンから抽出した三種類の特徴、
例えばストローク特徴と方向特徴と特徴点分布特徴とに
基づいて文字を認識するように構成されたもので、従来
例との相違は、重み変更部9を付加した点にある。この
重み変更部9は、総合判定部8が総合類似度S(k)の
算出に用いる、各特徴についての類似度S1(k),S
2(k),S3(k)に対する重みW1,W2,W3の
値を変更するものである。
と同様に入力文字パターンから抽出した三種類の特徴、
例えばストローク特徴と方向特徴と特徴点分布特徴とに
基づいて文字を認識するように構成されたもので、従来
例との相違は、重み変更部9を付加した点にある。この
重み変更部9は、総合判定部8が総合類似度S(k)の
算出に用いる、各特徴についての類似度S1(k),S
2(k),S3(k)に対する重みW1,W2,W3の
値を変更するものである。
【0028】上記重み変更部9には、予め、複数組の重
みW1,W2,W3の値が記憶されている。これらの重
みの組{Wi}の値は、文書の文字パターンの、かす
れ,つぶれ,右上がりなどといった状況に応じて、それ
ぞれ最も高い正解率が得られるような最適の値に、実験
的あるいは経験的に設定される。例えば、図2の説明図
に示すように、標準的な状況の文字パターンに対する重
みの組{W(O)}として{W1=0.33,W2=
0.33,W3=0.33}、かすれの強い文字パター
ンに対する重みの組{W(A)}として{0.1,0.
45,0.45}、変形の強い文字パターンに対する重
みの組{W(B)}として{0.45,0.45,0.
1}が、それぞれ記憶されている。
みW1,W2,W3の値が記憶されている。これらの重
みの組{Wi}の値は、文書の文字パターンの、かす
れ,つぶれ,右上がりなどといった状況に応じて、それ
ぞれ最も高い正解率が得られるような最適の値に、実験
的あるいは経験的に設定される。例えば、図2の説明図
に示すように、標準的な状況の文字パターンに対する重
みの組{W(O)}として{W1=0.33,W2=
0.33,W3=0.33}、かすれの強い文字パター
ンに対する重みの組{W(A)}として{0.1,0.
45,0.45}、変形の強い文字パターンに対する重
みの組{W(B)}として{0.45,0.45,0.
1}が、それぞれ記憶されている。
【0029】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図1,図2および図3の流れ
図を用いて説明する。
びその制御方法について、図1,図2および図3の流れ
図を用いて説明する。
【0030】予め、総合判定部8には、重みW1,W
2,W3の値として、重み変更部9に記憶させた複数の
重みの組{Wi}のうち、標準的な状況の文字パターン
に対する重みの組{W(O)}の値を設定しておく(ス
テップ1)。
2,W3の値として、重み変更部9に記憶させた複数の
重みの組{Wi}のうち、標準的な状況の文字パターン
に対する重みの組{W(O)}の値を設定しておく(ス
テップ1)。
【0031】そしていま、この文字認識装置に内蔵され
ている認識辞書の1番目の認識候補文字に相当する文字
パターンで、しかもかすれの強い文字パターンを、パタ
ーン入力部1に入力するとする(ステップ2)。
ている認識辞書の1番目の認識候補文字に相当する文字
パターンで、しかもかすれの強い文字パターンを、パタ
ーン入力部1に入力するとする(ステップ2)。
【0032】文字パターンを入力すると、従来例の場合
と同じように、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出する(ス
テップ3)。続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について、入
力文字パターンと、内蔵認識辞書の複数の認識候補文字
のパターンとの類似度S1(k),S2(k),S3
(k)を算出する(ステップ4)。
と同じように、第一,第二,第三の各特徴抽出部2,
3,4が、その入力文字パターンから、それぞれストロ
ーク特徴と方向特徴と特徴点分布特徴とを抽出する(ス
テップ3)。続いて第一,第二,第三の各類似度算出部
5,6,7が、抽出されたそれぞれの特徴について、入
力文字パターンと、内蔵認識辞書の複数の認識候補文字
のパターンとの類似度S1(k),S2(k),S3
(k)を算出する(ステップ4)。
【0033】このとき算出された、各特徴についての入
力文字パターンと1番目の認識候補文字のパターンとの
類似度S1(1),S2(1),S3(1)、および2
番目の認識候補文字のパターンとの類似度S1(2),
S2(2),S3(2)がそれぞれ、 S1(1)=0.2,S2(1)=0.4,S3(1)=0.6 S1(2)=0.6,S2(2)=0.3,S3(2)=0.4 であったとする。この算出結果で、入力文字パターン
と、その入力文字パターンの正解文字である1番目の認
識候補文字のパターンとの、ストローク特徴についての
類似度S1(1)が小さい値となるのは、かすれの強い
入力文字パターンからストローク特徴を抽出することが
困難であるためである。
力文字パターンと1番目の認識候補文字のパターンとの
類似度S1(1),S2(1),S3(1)、および2
番目の認識候補文字のパターンとの類似度S1(2),
S2(2),S3(2)がそれぞれ、 S1(1)=0.2,S2(1)=0.4,S3(1)=0.6 S1(2)=0.6,S2(2)=0.3,S3(2)=0.4 であったとする。この算出結果で、入力文字パターン
と、その入力文字パターンの正解文字である1番目の認
識候補文字のパターンとの、ストローク特徴についての
類似度S1(1)が小さい値となるのは、かすれの強い
入力文字パターンからストローク特徴を抽出することが
困難であるためである。
【0034】次いで、総合判定部8が、上記各類似度算
出部5,6,7による類似度算出結果に基づき、入力文
字パターンと認識候補文字のパターンとの総合類似度S
(k)を、従来例で示した数式1に従って、認識候補文
字の一つひとつについて算出する。そしてその総合類似
度S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ5)、その認識文字の文字コードを出力する
(ステップ6)。
出部5,6,7による類似度算出結果に基づき、入力文
字パターンと認識候補文字のパターンとの総合類似度S
(k)を、従来例で示した数式1に従って、認識候補文
字の一つひとつについて算出する。そしてその総合類似
度S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ5)、その認識文字の文字コードを出力する
(ステップ6)。
【0035】ところで上記認識文字判定時の、入力文字
パターンと、その正解文字である1番目の認識候補文字
のパターンとの総合類似度S(1)、および2番目の認
識候補文字のパターンとの総合類似度S(2)はそれぞ
れ、現在設定されている重みの組{W(O)}の値が
{0.33,0.33,0.33}であることから、 S(1)=0.4 S(2)=0.433 となる。
パターンと、その正解文字である1番目の認識候補文字
のパターンとの総合類似度S(1)、および2番目の認
識候補文字のパターンとの総合類似度S(2)はそれぞ
れ、現在設定されている重みの組{W(O)}の値が
{0.33,0.33,0.33}であることから、 S(1)=0.4 S(2)=0.433 となる。
【0036】即ち、正解文字である1番目の認識候補文
字のパターンとの総合類似度S(1)より、2番目の認
識候補文字のパターンとの類似度S(2)の方が大きな
値となる。その結果、総合判定部8は、2番目の認識候
補文字、あるいはその他の、最も高い総合類似度となる
認識候補文字を認識文字と判定してしまい、正解文字の
文字コードとは別の誤った文字コードを出力することに
なる。このように誤った文字コードを出力した原因は、
現在設定されている重みの組{W(i)}が、入力文字
パターンの状況に適していないことにある。
字のパターンとの総合類似度S(1)より、2番目の認
識候補文字のパターンとの類似度S(2)の方が大きな
値となる。その結果、総合判定部8は、2番目の認識候
補文字、あるいはその他の、最も高い総合類似度となる
認識候補文字を認識文字と判定してしまい、正解文字の
文字コードとは別の誤った文字コードを出力することに
なる。このように誤った文字コードを出力した原因は、
現在設定されている重みの組{W(i)}が、入力文字
パターンの状況に適していないことにある。
【0037】そこで、総合判定部8が誤った文字コード
を出力した場合には(ステップ7)、操作者が重み変更
部9に、正解文字の文字コードを入力する(ステップ
8)。
を出力した場合には(ステップ7)、操作者が重み変更
部9に、正解文字の文字コードを入力する(ステップ
8)。
【0038】すると重み変更部9は、総合判定部8に設
定されている重みW1,W2,W3の値を、入力された
正解文字の文字コードに相当する認識候補文字が最も高
い総合類似度S(k)となるような値に変更する。つま
り重み変更部9は、総合判定部8に現在設定されている
重みの組{W(O)}を、重み変更部9が記憶してい
る、{W(O)}以外の重みの組{W(A)},{W
(B)}のうち、正解文字が最も高い総合類似度S
(k)となるような重みの組に変更する(ステップ
9)。
定されている重みW1,W2,W3の値を、入力された
正解文字の文字コードに相当する認識候補文字が最も高
い総合類似度S(k)となるような値に変更する。つま
り重み変更部9は、総合判定部8に現在設定されている
重みの組{W(O)}を、重み変更部9が記憶してい
る、{W(O)}以外の重みの組{W(A)},{W
(B)}のうち、正解文字が最も高い総合類似度S
(k)となるような重みの組に変更する(ステップ
9)。
【0039】入力文字パターンと、正解文字である1番
目の認識候補文字のパターンとの総合類似度S(1)
を、かすれの強い文字パターンに対する重みの組{W
(A)}、および変形の強い文字パターンに対する重み
の組{W(B)}を用いて算出すると、それぞれ、 {W(A)}では、S(1)=0.47 {W(B)}では、S(1)=0.33 となる。よって、かすれの強い文字パターンに対する重
みの組{W(A)}に変更することになる。これは、入
力文字パターンがかすれの強い文字パターンであること
から、当然の結果である。
目の認識候補文字のパターンとの総合類似度S(1)
を、かすれの強い文字パターンに対する重みの組{W
(A)}、および変形の強い文字パターンに対する重み
の組{W(B)}を用いて算出すると、それぞれ、 {W(A)}では、S(1)=0.47 {W(B)}では、S(1)=0.33 となる。よって、かすれの強い文字パターンに対する重
みの組{W(A)}に変更することになる。これは、入
力文字パターンがかすれの強い文字パターンであること
から、当然の結果である。
【0040】その後、総合判定部8は、正解文字の文字
コードを出力し直す(ステップ10)。その際、総合判
定部8に、正解文字の得られなかった入力文字パターン
について、変更された重みの組{W(A)}に基づく認
識文字の再判定を行わせる必要はなく、操作者が入力し
た正解文字の文字コードをそのまま出力させるようにす
ればよい。
コードを出力し直す(ステップ10)。その際、総合判
定部8に、正解文字の得られなかった入力文字パターン
について、変更された重みの組{W(A)}に基づく認
識文字の再判定を行わせる必要はなく、操作者が入力し
た正解文字の文字コードをそのまま出力させるようにす
ればよい。
【0041】これ以降の入力文字パターンについては、
総合判定部8が、変更された重みの組{W(A)}に基
づいて認識文字の判定を行い、その認識文字の文字コー
ドを出力する。そして総合判定部8が再び誤った文字コ
ードを出力するまで、上記ステップ2〜7を繰り返す。
総合判定部8が、変更された重みの組{W(A)}に基
づいて認識文字の判定を行い、その認識文字の文字コー
ドを出力する。そして総合判定部8が再び誤った文字コ
ードを出力するまで、上記ステップ2〜7を繰り返す。
【0042】上述のように、重み変更部9を付加したこ
の文字認識装置では、文字パターンの状況に応じて重み
の組{W(i)}を最適なものに変更することができる
ため、認識文字の正解率を高めることができる。しかも
総合判定部8が誤った文字コードを出力した場合に正解
文字の文字コードを入力するだけでよいため、操作が簡
単である。またこの文字認識装置が行うべき処理も単純
であるため、文字認識における高いスループットが得ら
れる。さらに重み変更部9には、文字パターンの数種類
の状況に対応した重みの組{W(i)}を記憶させる小
さな記憶領域を設ければよいため、この重み変更部9を
安価な部品で構成することができる。
の文字認識装置では、文字パターンの状況に応じて重み
の組{W(i)}を最適なものに変更することができる
ため、認識文字の正解率を高めることができる。しかも
総合判定部8が誤った文字コードを出力した場合に正解
文字の文字コードを入力するだけでよいため、操作が簡
単である。またこの文字認識装置が行うべき処理も単純
であるため、文字認識における高いスループットが得ら
れる。さらに重み変更部9には、文字パターンの数種類
の状況に対応した重みの組{W(i)}を記憶させる小
さな記憶領域を設ければよいため、この重み変更部9を
安価な部品で構成することができる。
【0043】なお、文字パターンのより多くの種類の状
況に対応させて、重みの組{W(i)}を重み変更部9
に記憶させておけば、それだけ認識文字の正解率を高め
ることができる。
況に対応させて、重みの組{W(i)}を重み変更部9
に記憶させておけば、それだけ認識文字の正解率を高め
ることができる。
【0044】また、上記文字認識装置では、抽出する入
力文字パターンの特徴を三種類としたが、より多くの種
類の特徴を抽出するように構成すれば、それだけ認識文
字の正解率を高めることができる。その場合には、各重
みの組{W(i)}を構成する重みの数も、抽出する特
徴の数と同じに増加させることになる。
力文字パターンの特徴を三種類としたが、より多くの種
類の特徴を抽出するように構成すれば、それだけ認識文
字の正解率を高めることができる。その場合には、各重
みの組{W(i)}を構成する重みの数も、抽出する特
徴の数と同じに増加させることになる。
【0045】実施例 図4は、本発明にかかる実施例の文字認識装置のブロッ
ク構成図である。
ク構成図である。
【0046】図のように、この文字認識装置では、上記
関連技術において説明した装置の重み変更部9の代わり
に、重み設定部10が設けられている。その他の構成
は、上記関連技術の装置と同様である。
関連技術において説明した装置の重み変更部9の代わり
に、重み設定部10が設けられている。その他の構成
は、上記関連技術の装置と同様である。
【0047】上記重み設定部10は、総合判定部8が総
合類似度S(k)の算出に用いる、各特徴についての類
似度S1(k),S2(k),S3(k)に対する重み
W1,W2,W3の値を、後述の如く操作者の指示に応
じて設定するものである。そしてこの重み設定部10に
は、上記実施例1における重み変更部9の場合と同じよ
うに、文書の文字パターンの種々の状況に適した複数の
重みの組{Wi}、例えば標準的な状況の文字パターン
に対する重みの組{W(O)}と、かすれの強い文字パ
ターンに対する重みの組{W(A)}と、変形の強い文
字パターンに対する重みの組{W(B)}とを予め記憶
させておく。
合類似度S(k)の算出に用いる、各特徴についての類
似度S1(k),S2(k),S3(k)に対する重み
W1,W2,W3の値を、後述の如く操作者の指示に応
じて設定するものである。そしてこの重み設定部10に
は、上記実施例1における重み変更部9の場合と同じよ
うに、文書の文字パターンの種々の状況に適した複数の
重みの組{Wi}、例えば標準的な状況の文字パターン
に対する重みの組{W(O)}と、かすれの強い文字パ
ターンに対する重みの組{W(A)}と、変形の強い文
字パターンに対する重みの組{W(B)}とを予め記憶
させておく。
【0048】次に、上記構成の文字認識装置の動作およ
びその制御方法について、図4および図5の流れ図を用
いて説明する。
びその制御方法について、図4および図5の流れ図を用
いて説明する。
【0049】先ず、文書の文字パターンを入力する前
に、操作者がその入力する文字パターンの状況を判断す
るとともに、重み設定部10に対し、その判断した状況
に最適な重みの組{Wi}を総合判定部8に設定するよ
うに指示する。その指示方法として、ここでは、重み設
定部10に文字パターンの状況を入力する(ステップ1
1)。なお、重み設定部10に対し、最適な重みの組
{Wi}そのものを指示するようにしてもよい。
に、操作者がその入力する文字パターンの状況を判断す
るとともに、重み設定部10に対し、その判断した状況
に最適な重みの組{Wi}を総合判定部8に設定するよ
うに指示する。その指示方法として、ここでは、重み設
定部10に文字パターンの状況を入力する(ステップ1
1)。なお、重み設定部10に対し、最適な重みの組
{Wi}そのものを指示するようにしてもよい。
【0050】すると重み設定部10が、記憶している複
数の重みの組{Wi}から、入力された文字パターンの
状況に最適な重みの組を選択して総合判定部8に設定す
る(ステップ12)。この状態で、文書の文字パターン
を、パターン入力部1に入力する(ステップ13)。
数の重みの組{Wi}から、入力された文字パターンの
状況に最適な重みの組を選択して総合判定部8に設定す
る(ステップ12)。この状態で、文書の文字パターン
を、パターン入力部1に入力する(ステップ13)。
【0051】文字パターンを入力すると、第一、第二、
第三の各特徴抽出部2,3,4が、その入力文字パター
ンから、それぞれストローク特徴と方向特徴と特徴点分
布特徴とを抽出し(ステップ14)、続いて第一、第
二、第三の各類似度算出部5,6,7が、抽出されたそ
れぞれの特徴について類似度S1(k),S2(k),
S3(k)を算出する(ステップ15)。さらに総合判
定部8が、各類似度算出部5,6,7による類似度算出
結果に基づいて総合類似度S(k)を、認識候補文字の
一つひとつについて算出する。そして、その総合類似度
S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ16)、その認識文字の文字コードを出力す
る(ステップ17)。
第三の各特徴抽出部2,3,4が、その入力文字パター
ンから、それぞれストローク特徴と方向特徴と特徴点分
布特徴とを抽出し(ステップ14)、続いて第一、第
二、第三の各類似度算出部5,6,7が、抽出されたそ
れぞれの特徴について類似度S1(k),S2(k),
S3(k)を算出する(ステップ15)。さらに総合判
定部8が、各類似度算出部5,6,7による類似度算出
結果に基づいて総合類似度S(k)を、認識候補文字の
一つひとつについて算出する。そして、その総合類似度
S(k)の算出結果に基づいて認識文字の判定を行い
(ステップ16)、その認識文字の文字コードを出力す
る(ステップ17)。
【0052】このとき、総合判定部8が総合類似度S
(k)の算出に用いる重みの組{Wi}は、既に入力文
字パターンの状況に最適なものに設定されているため、
総合判定部8は非常に高い率で正解文字の文字コードを
出力することになる。
(k)の算出に用いる重みの組{Wi}は、既に入力文
字パターンの状況に最適なものに設定されているため、
総合判定部8は非常に高い率で正解文字の文字コードを
出力することになる。
【0053】そして、入力する文字パターンの状況が変
化する場合には(ステップ18)、操作者が改めてその
入力する文字パターンの状況を重み設定部10に入力し
(ステップ11)、また入力する文字パターンの状況が
変化しなければ、文字認識装置が上記ステップ13〜1
8を繰り返し、次々と入力される文字パターンに対して
文字認識を行う。
化する場合には(ステップ18)、操作者が改めてその
入力する文字パターンの状況を重み設定部10に入力し
(ステップ11)、また入力する文字パターンの状況が
変化しなければ、文字認識装置が上記ステップ13〜1
8を繰り返し、次々と入力される文字パターンに対して
文字認識を行う。
【0054】上述のように、本実施例における文字認識
装置の場合、入力文字パターンの状況に最適な重みの組
{W(i)}を、重み設定部10によって総合判定部8
に設定することができるため、認識文字の正解率を高め
ることができる。しかも本実施例においては、文字パタ
ーンの認識を開始する以前に、その文字パターンに最適
な重みの組{W(i)}を設定することができるため、
文字認識の開始時から高い正解率を得ることができる。
その他、操作が簡単であると共に、高いスループットが
得られ、さらに重み設定部10を安価な部品で構成する
ことができるといった利点がある。
装置の場合、入力文字パターンの状況に最適な重みの組
{W(i)}を、重み設定部10によって総合判定部8
に設定することができるため、認識文字の正解率を高め
ることができる。しかも本実施例においては、文字パタ
ーンの認識を開始する以前に、その文字パターンに最適
な重みの組{W(i)}を設定することができるため、
文字認識の開始時から高い正解率を得ることができる。
その他、操作が簡単であると共に、高いスループットが
得られ、さらに重み設定部10を安価な部品で構成する
ことができるといった利点がある。
【0055】ところで、実際に入力する文字パターンの
状況には、典型的なものであるとしてあらかじめ想定し
てあった複数の状況が混在する場合がある。例えば、前
述したかすれが強い文字パターンの状況において、非常
にかすれており、変形などの他の状況の特徴が表れてい
ない場合を、典型的なかすれが強い文字パターンとし、
このときの重みの組を{W(A)}として記憶する。ま
た、他の状況に関してもその状況のみが強く表れた文字
パターンを典型例として、その場合の重みの組を記憶す
る。典型的な変形が強い文字パターンの場合の重みの組
を{W(B)}として、以下説明する。操作者は、入力
文字パターンの状況を判断して、各パターンの程度を入
力する。例えば、かすれの程度、変形の程度を入力す
る。この入力された、各文字パターンの状況の程度に基
づきパラメータNa,Nbが設定される。そして、[N
a*{W(A)}+Nb*{W(B)}]によって、認
識対象となる文字パターンの新たな重みの組を生成す
る。このように、典型的な文字パターンに対応する重み
の組から、認識対象となる文字パターンの状況に適した
新たな重みの組が作成される。これにより、典型的な文
字パターンの状況に対応した重みの組のみ記憶しておけ
ばよく、小さな記憶容量であっても足りる。
状況には、典型的なものであるとしてあらかじめ想定し
てあった複数の状況が混在する場合がある。例えば、前
述したかすれが強い文字パターンの状況において、非常
にかすれており、変形などの他の状況の特徴が表れてい
ない場合を、典型的なかすれが強い文字パターンとし、
このときの重みの組を{W(A)}として記憶する。ま
た、他の状況に関してもその状況のみが強く表れた文字
パターンを典型例として、その場合の重みの組を記憶す
る。典型的な変形が強い文字パターンの場合の重みの組
を{W(B)}として、以下説明する。操作者は、入力
文字パターンの状況を判断して、各パターンの程度を入
力する。例えば、かすれの程度、変形の程度を入力す
る。この入力された、各文字パターンの状況の程度に基
づきパラメータNa,Nbが設定される。そして、[N
a*{W(A)}+Nb*{W(B)}]によって、認
識対象となる文字パターンの新たな重みの組を生成す
る。このように、典型的な文字パターンに対応する重み
の組から、認識対象となる文字パターンの状況に適した
新たな重みの組が作成される。これにより、典型的な文
字パターンの状況に対応した重みの組のみ記憶しておけ
ばよく、小さな記憶容量であっても足りる。
【0056】
【発明の効果】以上説明したとおり、文字パターンの状
況に合わせて重みの組を変更することにより、高い正解
率で文字を認識することができる。
況に合わせて重みの組を変更することにより、高い正解
率で文字を認識することができる。
【0057】また、文字認識を始める前に、その文字パ
ターンに適切な重みの値を設定することができるため、
文字認識の最初から、高い正解率を得ることができる。
ターンに適切な重みの値を設定することができるため、
文字認識の最初から、高い正解率を得ることができる。
【0058】また、典型的なパターンの重みの組を合成
することにより、新たな重みの組を算出することによ
り、実際の文字パターンの状況が典型例のいつくかが重
なったような場合においても、適切な重み付けをするこ
とができる。そして、実際の文字パターンの状況を予め
設定されたパターン状況の組み合わせとして表すことに
より、予め設定するパターン状況の種類を少なくするこ
とができる。
することにより、新たな重みの組を算出することによ
り、実際の文字パターンの状況が典型例のいつくかが重
なったような場合においても、適切な重み付けをするこ
とができる。そして、実際の文字パターンの状況を予め
設定されたパターン状況の組み合わせとして表すことに
より、予め設定するパターン状況の種類を少なくするこ
とができる。
【図1】本発明の実施例1における文字認識装置のブロ
ック構成図である。
ック構成図である。
【図2】実施例1における重み変更部に記憶される重み
の組の説明図である。
の組の説明図である。
【図3】実施例1における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
の制御方法を説明する流れ図である。
【図4】本発明の実施例2における文字認識装置のブロ
ック構成図である。
ック構成図である。
【図5】実施例2における文字認識装置の動作およびそ
の制御方法を説明する流れ図である。
の制御方法を説明する流れ図である。
【図6】従来の文字認識装置のブロック構成図である。
1 パターン入力部 2,3,4 特徴抽出部 5,6,7 類似度算出部 8 総合判定部 9 重み変更部 10 重み設定部
Claims (3)
- 【請求項1】 文字パターンが入力されるパターン入力
部と、 上記パターン入力部に入力された文字パターンからそれ
ぞれひとつの特徴を抽出する複数の特徴抽出部と、 上記各特徴抽出部で抽出されたそれぞれの特徴につい
て、上記入力文字パターンと内蔵認識辞書の認識候補文
字のパターンとの類似度を算出する複数の類似度算出部
と、 上記各類似度算出部で算出された各特徴についての類似
度に、その各類似度に対する重みを乗じて和をとること
により、上記入力文字パターンと認識候補文字のパター
ンとの総合類似度を一つひとつの認識候補文字について
算出し、最も高い総合類似度となる認識候補文字を認識
文字と判定してその認識文字の文字コードを出力する総
合判定部と、 を備えた文字認識装置において、前記重みを、文字パターンの状況に対応した、各類似度
に対する重みの組として、複数の文字パターンの状況に
対応して複数組記憶する記憶手段と、 操作者が判断した前記入力される文字パターンの状況を
受け付ける入力手段と、 前記入力された文字パターンの状況に基づき、前記記憶
された重みの組の中から適切な重みの組を選択する選択
手段と、 を有し、前記総合判定部は前記選択された重みの組を用
いる、 文字認識装置。 - 【請求項2】 文字パターンが入力されるパターン入力
部と、 上記パターン入力部に入力された文字パターンからそれ
ぞれひとつの特徴を抽出する複数の特徴抽出部と、 上記各特徴抽出部で抽出されたそれぞれの特徴につい
て、上記入力文字パターンと内蔵認識辞書の認識候補文
字のパターンとの類似度を算出する複数の類似度算出部
と、 上記各類似度算出部で算出された各特徴についての類似
度に、その各類似度に対する重みを乗じて和をとること
により、上記入力文字パターンと認識候補文字のパター
ンとの総合類似度を一つひとつの認識候補文字について
算出し、最も高い総合類似度となる認識候補文字を認識
文字と判定してその認識文字の文字コードを出力する総
合判定部と、 を備えた文字認識装置において、前記重みを、文字パターンの状況に対応した、各類似度
に対する重みの組として、複数の文字パターンの状況に
対応して複数組記憶する記憶手段と、 操作者が前記入力される文字パターンの状況に基づき判
断した重みの組の指示を受け付ける入力手段と、 前記重みの組の指示に基づき、前記記憶された重みの組
の中から指示された重みの組を選択する選択手段と、 を有し、前記総合判定部は前記選択された重みの組を用
いる、 文字認識装置。 - 【請求項3】 文字パターンが入力されるパターン入力
部と、 上記パターン入力部に入力された文字パターンからそれ
ぞれひとつの特徴を抽出する複数の特徴抽出部と、 上記各特徴抽出部で抽出されたそれぞれの特徴につい
て、上記入力文字パターンと内蔵認識辞書の認識候補文
字のパターンとの類似度を算出する複数の類似度算出部
と、 上記各類似度算出部で算出された各特徴についての類似
度に、その各類似度に対する重みを乗じて和をとること
により、上記入力文字パターンと認識候補文字のパター
ンとの総合類似度を一つひとつの認識候補文字について
算出し、最も高い総合類似度となる認識候補文字を認識
文字と判定してその認識文字の文字コードを出力する総
合判定部と、 を備えた文字認識装置において、前記重みを、複数の典型的な文字パターンの状況に対応
した、各類似度に対する重みの組として記憶する記憶手
段と、 操作者が指定した前記複数の典型的文字パターンの状況
に関するそれぞれの程度を受け付ける入力手段と、 前記入力された典型的文字パターンの程度に基づき、対
応する重みの組に対するパラメータを設定し、このパラ
メータと前記記憶された重みの組とに基づき、新たな重
みの組を算出する手段と、 を有し、 前記総合判定部は前記新たに算出された重みの組を用い
る、 文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04114904A JP3110552B2 (ja) | 1992-05-07 | 1992-05-07 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04114904A JP3110552B2 (ja) | 1992-05-07 | 1992-05-07 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH05314317A JPH05314317A (ja) | 1993-11-26 |
| JP3110552B2 true JP3110552B2 (ja) | 2000-11-20 |
Family
ID=14649542
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP04114904A Expired - Fee Related JP3110552B2 (ja) | 1992-05-07 | 1992-05-07 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3110552B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3761937B2 (ja) * | 1995-09-18 | 2006-03-29 | キヤノン株式会社 | パターン認識方法及び装置及びコンピュータ制御装置 |
| JP2002189983A (ja) * | 2000-12-21 | 2002-07-05 | Toshiba Corp | 文字認識装置と配達物処理装置 |
| JP5974576B2 (ja) * | 2012-03-26 | 2016-08-23 | 富士ゼロックス株式会社 | 文字認識学習装置、文字認識装置、およびプログラム |
| JP6003492B2 (ja) * | 2012-10-01 | 2016-10-05 | 富士ゼロックス株式会社 | 文字認識装置及びプログラム |
| US10112203B2 (en) | 2013-04-17 | 2018-10-30 | S.C. Johnson & Son, Inc. | Portable volatile material dispenser and method of simulating a flame in same |
-
1992
- 1992-05-07 JP JP04114904A patent/JP3110552B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH05314317A (ja) | 1993-11-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3155577B2 (ja) | 文字認識方法及び装置 | |
| JP3480404B2 (ja) | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 | |
| EP0784285A2 (en) | Method and apparatus for generating a classification tree | |
| JPH0612524A (ja) | 文字認識方式 | |
| JP3110552B2 (ja) | 文字認識装置 | |
| JP3792755B2 (ja) | 文字認識方法及び装置 | |
| CN117291149A (zh) | 生僻字解码方法、装置、电子设备及存储介质 | |
| US5787202A (en) | Character recognition apparatus | |
| JPS5922179A (ja) | 文字認識方法 | |
| JP3242224B2 (ja) | 手書文字認識装置 | |
| JP3249654B2 (ja) | 活字文字認識用辞書の作成方法 | |
| JP2003242445A (ja) | ナンバープレート読取装置 | |
| CN119273997B (zh) | 多模态自动标注方法、装置、存储介质及电子设备 | |
| JP2766205B2 (ja) | 文字認識装置 | |
| JP3706646B2 (ja) | Ocrの制御方法並びに分類方法及び装置 | |
| JP3815934B2 (ja) | 手書き文字認識装置および方法 | |
| JP5020513B2 (ja) | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 | |
| JP2874815B2 (ja) | 日本語文字読取装置 | |
| JPH103518A (ja) | 文字認識方法,記憶媒体および文字認識装置 | |
| JPH04138583A (ja) | 文字認識装置 | |
| JPS62281082A (ja) | 文字認識装置 | |
| JP3213151B2 (ja) | ニューラルネットワークを用いたパターン認識装置の学習方法および学習装置 | |
| JP2882327B2 (ja) | 線図形整合装置 | |
| JP4143148B2 (ja) | 文字認識装置 | |
| JP2895486B2 (ja) | 文字認識方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080914 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |