JPH03161890A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03161890A JPH03161890A JP1301248A JP30124889A JPH03161890A JP H03161890 A JPH03161890 A JP H03161890A JP 1301248 A JP1301248 A JP 1301248A JP 30124889 A JP30124889 A JP 30124889A JP H03161890 A JPH03161890 A JP H03161890A
- Authority
- JP
- Japan
- Prior art keywords
- characters
- character
- distance
- candidate
- distance difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000012805 post-processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は、文字認識装置に係り、修正作業の簡便化や単
語照合等の後処理の精度を向上させるため、認識候補文
字を最小限に絞り込む文字認識装置に関するものである
。
語照合等の後処理の精度を向上させるため、認識候補文
字を最小限に絞り込む文字認識装置に関するものである
。
(ロ)従来技術
従来の文字認識では、認識結果として、候補文字は定数
個(通常10個程度)に固定されているものがある。ま
た電子情報通信学会論文誌(D)Vol.J71−D
No.6 ppl037−1047 1988年6月の
論文「情景画像からの文字パターン抽出と認識」に開示
されているように、各文字カテゴリ毎に距離(または類
似度)のしきい値が設定されて、個数可変のものがある
。更に、電子情報通信学会論文誌D−IIVol. J
72−D− II No.7 pp993−1000
1989年7月の論文「候補文字補完と言語処理に
よる漢字認識の誤り訂正処理法」に開示されているよう
に、固定しきい値により制限を加えたもの等の種々の方
式によりある程度候補文字は絞られていたが、十分とは
いえなかった。
個(通常10個程度)に固定されているものがある。ま
た電子情報通信学会論文誌(D)Vol.J71−D
No.6 ppl037−1047 1988年6月の
論文「情景画像からの文字パターン抽出と認識」に開示
されているように、各文字カテゴリ毎に距離(または類
似度)のしきい値が設定されて、個数可変のものがある
。更に、電子情報通信学会論文誌D−IIVol. J
72−D− II No.7 pp993−1000
1989年7月の論文「候補文字補完と言語処理に
よる漢字認識の誤り訂正処理法」に開示されているよう
に、固定しきい値により制限を加えたもの等の種々の方
式によりある程度候補文字は絞られていたが、十分とは
いえなかった。
(ハ)発明が解決しようとする課題
候補文字の数は、選択する側の繁雑さからすると、でき
るだけ少ないことが望ましい。
るだけ少ないことが望ましい。
従来の各方法では候補の絞り込みが十分でなく、修正作
業において、候補選択の際に、ほとんど類似していない
ような文字まで候補に挙がっており、選択が繁雑であっ
た。
業において、候補選択の際に、ほとんど類似していない
ような文字まで候補に挙がっており、選択が繁雑であっ
た。
また、認識後に単語照合等の後処理にかける場合には、
候補文字が必要以上に多くなるため、組合せの数が増え
ることにより、別の単語と照合されてしまい、正しい結
果が得られないことがあった。
候補文字が必要以上に多くなるため、組合せの数が増え
ることにより、別の単語と照合されてしまい、正しい結
果が得られないことがあった。
本発明は、上述した従来の問題点に鑑み、認識精度を損
なうことなく候補文字の数を絞り込み、修正作業を容易
に、あるいは後処理を高精度にすることをその課題とす
る。
なうことなく候補文字の数を絞り込み、修正作業を容易
に、あるいは後処理を高精度にすることをその課題とす
る。
(二)課題を解決するための手段
本発明は、各文字カテゴリ毎の標準字体をもつ標準パタ
ーン辞書と、入力された文字パターンと上記標準パター
ン辞書に登録されている文字種との間の標準パターン間
距離を算出するパターン間距離算出部と、算出された距
離の小さい順に文字を並べ替える距離順並べ替え部と、
候補文字をおおまかに限定する第1次候補文字絞り部と
、並べ替え後の隣合う文字の間の距離差を算出するとと
もに距離差計算部と距離差の平均並びに分散を計算し、
候補文字の絞り込みの可否を判定しかつ最大距離差のと
ころで、候補文字とそれ以外に分割する第2次候補文字
絞り部とを具備し、 距離差の最大となるところを見つ
けることにより、それより距離の小さい文字を候補文字
として残し、それ以外は棄却することを特徴とする。
ーン辞書と、入力された文字パターンと上記標準パター
ン辞書に登録されている文字種との間の標準パターン間
距離を算出するパターン間距離算出部と、算出された距
離の小さい順に文字を並べ替える距離順並べ替え部と、
候補文字をおおまかに限定する第1次候補文字絞り部と
、並べ替え後の隣合う文字の間の距離差を算出するとと
もに距離差計算部と距離差の平均並びに分散を計算し、
候補文字の絞り込みの可否を判定しかつ最大距離差のと
ころで、候補文字とそれ以外に分割する第2次候補文字
絞り部とを具備し、 距離差の最大となるところを見つ
けることにより、それより距離の小さい文字を候補文字
として残し、それ以外は棄却することを特徴とする。
(ホ)作用
候補文字を絞り込むことができるかどうかは、距離差の
バラッキが大きいかそうでないかによって決定するため
、類似文字の少ない場合には、類似文字とそうでない文
字との間に明らかな距離差を生じる。したがって、距離
差に候補文字と棄却文字の分離点が求まり、候補は絞ら
れる。逆に、類似文字の多い場合は無理に候補を絞るこ
とは避け、候補文字は全て残されることになる。
バラッキが大きいかそうでないかによって決定するため
、類似文字の少ない場合には、類似文字とそうでない文
字との間に明らかな距離差を生じる。したがって、距離
差に候補文字と棄却文字の分離点が求まり、候補は絞ら
れる。逆に、類似文字の多い場合は無理に候補を絞るこ
とは避け、候補文字は全て残されることになる。
以上のように、この発明は、無理なくかつ効果的に候補
文字が絞られる。
文字が絞られる。
(へ)実施例
以下、本発明の一実施例を図面を参照して説明する。
本発明においては、候補文字の絞り込みは、候補文字を
距離の小さい順(類似度の大きい順)に並べた際の、距
離差に基づいて行われる。
距離の小さい順(類似度の大きい順)に並べた際の、距
離差に基づいて行われる。
まず本発明の概念につき第1図に従い説明する。第1図
は候補文字を距離の小さい順に並べたときの様子を示す
概念図であり、この図においては第1次候補文字を10
個としている。同図では、黒丸が1つの候補文字を表し
、距離を横軸として、距離軸方向の分布を示す。
は候補文字を距離の小さい順に並べたときの様子を示す
概念図であり、この図においては第1次候補文字を10
個としている。同図では、黒丸が1つの候補文字を表し
、距離を横軸として、距離軸方向の分布を示す。
第1図(a)は距離差にバラツキがある場合を示し、図
中の破線の所で距離差が最大となっている。すなわち、
第3位の文字と第4位の文字の間には有意な距離差があ
り、そこを境に候補文字に含める文字と、棄却すべき文
字のグループとを分離することができる。
中の破線の所で距離差が最大となっている。すなわち、
第3位の文字と第4位の文字の間には有意な距離差があ
り、そこを境に候補文字に含める文字と、棄却すべき文
字のグループとを分離することができる。
また、第1図(b)は、距離差はほぼ同じである場合を
示す。この場合は、第1図(a)の場合にように2つの
グループに分離することは危険である。この場合には、
強制的に候補を絞り込むことは避け、すべての文字を候
補文字として残す。
示す。この場合は、第1図(a)の場合にように2つの
グループに分離することは危険である。この場合には、
強制的に候補を絞り込むことは避け、すべての文字を候
補文字として残す。
実際の場合に当てはめてみると、第1図(a)は比較的
類似文字の少ない場合に相当し、第1図(b)は類似文
字が多く存在する場合に相当する。
類似文字の少ない場合に相当し、第1図(b)は類似文
字が多く存在する場合に相当する。
本発明においては、まず、第l図の(a)の場合である
か、(b)の場合であるかの判定が必要である。
か、(b)の場合であるかの判定が必要である。
この判定につき、まず説明すると、各候補文字間の距離
差の平均を求め、その値よりも極端に大きいものがある
かどうかを判定基準とする。すなわち、極端に大きいも
のがあれば、候補文字はさらに絞り込み可能であると考
える。もしそうでなければ、これ以上の絞り込みは行わ
ない。
差の平均を求め、その値よりも極端に大きいものがある
かどうかを判定基準とする。すなわち、極端に大きいも
のがあれば、候補文字はさらに絞り込み可能であると考
える。もしそうでなければ、これ以上の絞り込みは行わ
ない。
この方式では、候補文字数があらかじめ数文字に限定さ
れている必要がある(第1図では10候補であった)。
れている必要がある(第1図では10候補であった)。
このため、第1段階として、従来法を用いて候補文字を
数文字に限定しておく。第2段階では、上記の方式によ
り、その候補文字群の距離差を求め、可能であれば、候
補に含める文字と棄却する文字とに分割を行う。
数文字に限定しておく。第2段階では、上記の方式によ
り、その候補文字群の距離差を求め、可能であれば、候
補に含める文字と棄却する文字とに分割を行う。
次に第2図および第3図に従い本発明を更に説明する。
第2図は本発明の構成の一例を示す構成図、第3図は処
理の流れ図を示す。
理の流れ図を示す。
パターン間距離算出部2では、入力された文字パターン
lと標準パターン辞書3に登録されている文字種全てに
対し、特徴比較を行い標準パターンとのパターン間距離
を算出する。標準パターン辞書3は各文字カテゴリ毎の
標準字体が格納されている。パターン間距離算出部2で
得られた結果すなわち、文字種とその距離値は、距離順
並べ替え部4に与えられる。距離順並べ替え部4では、
第1図に示すように、距離の小さい順に並び替えられる
。そして、並び替えられたデータは第l次候補文字絞り
部5に与えられる。第l次候補文字絞り部5は与えられ
たデータに基づき、数候補に絞る。この処理では、従来
法を用いて候補をおおまかに絞り込む。この処理は、単
に候補文字を定数個(例えば、lO個程度)に絞る程度
でもよいし、あるいは、文字カテゴリ毎にしきい値を設
定することによって候補を絞ってもよい。
lと標準パターン辞書3に登録されている文字種全てに
対し、特徴比較を行い標準パターンとのパターン間距離
を算出する。標準パターン辞書3は各文字カテゴリ毎の
標準字体が格納されている。パターン間距離算出部2で
得られた結果すなわち、文字種とその距離値は、距離順
並べ替え部4に与えられる。距離順並べ替え部4では、
第1図に示すように、距離の小さい順に並び替えられる
。そして、並び替えられたデータは第l次候補文字絞り
部5に与えられる。第l次候補文字絞り部5は与えられ
たデータに基づき、数候補に絞る。この処理では、従来
法を用いて候補をおおまかに絞り込む。この処理は、単
に候補文字を定数個(例えば、lO個程度)に絞る程度
でもよいし、あるいは、文字カテゴリ毎にしきい値を設
定することによって候補を絞ってもよい。
続いて、データは第2次候補文字絞り部6に送られる。
第2次候補文字絞り部6は距離差計算部61、平均並び
に分散計算部62、絞り込み可否判定部、および候補文
字分離部64を備え、次のような処理が行われる。
に分散計算部62、絞り込み可否判定部、および候補文
字分離部64を備え、次のような処理が行われる。
まず、必要であれば距離値の小さい順に並べ替えた後、
(本実施例では第1次候補文字絞り部の時点においてす
でに距離順に並んでいるため第2図では省略してある。
(本実施例では第1次候補文字絞り部の時点においてす
でに距離順に並んでいるため第2図では省略してある。
)距離差計算部61にデータが与えられる。距離差計算
部61おいて、隣合う文字の距離の差分を計算する。平
均並びに分散計算部62では、距離差の平均並びに分散
値を計算する。そして、絞り込み可否判定部63では、
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。具体的には、以下の式を
満たす距離差のものが存在する場合には、候補文字分離
部64が、最大の距離差のところで分割し、候補文字と
それ以上の距離の文字候補は棄却する。
部61おいて、隣合う文字の距離の差分を計算する。平
均並びに分散計算部62では、距離差の平均並びに分散
値を計算する。そして、絞り込み可否判定部63では、
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。具体的には、以下の式を
満たす距離差のものが存在する場合には、候補文字分離
部64が、最大の距離差のところで分割し、候補文字と
それ以上の距離の文字候補は棄却する。
(距離差)〉(距離差平均)+(距離差の分散の2倍)
もし、上式を満たす距離差のものがない場合には、第1
次候補文字絞り部5で選別された、文字をそのまま候補
文字として採用する。
次候補文字絞り部5で選別された、文字をそのまま候補
文字として採用する。
得られた候補文字は、後処理部7に渡され、単語照合等
の処理が行われる。
の処理が行われる。
また、第2図の例では示していないが、後処理を行わな
い場合には、修正時に次候補文字とじて採用される。
い場合には、修正時に次候補文字とじて採用される。
次に本発明の処理手順につき第3図の流れ図に従い説明
する。
する。
ステップS1において、パターン間距離算出部2で、入
力された文字パターンと標準パターン辞書3に登録され
ている文字種全てに対し、特徴比較を行う。
力された文字パターンと標準パターン辞書3に登録され
ている文字種全てに対し、特徴比較を行う。
続いて、ステップS2において、ステップS1で得られ
た結果(文字種とその距離値)が、距離順並べ替え部4
で、距離の小さい順に並び替えられる。
た結果(文字種とその距離値)が、距離順並べ替え部4
で、距離の小さい順に並び替えられる。
ステップS3では、第1次候補文字絞り部5によって数
候補に絞られる。
候補に絞られる。
その後、第2次候補文字絞り部6での処理が行なわれる
。第2次候補文字絞り部6では、次のような処理が行わ
れる。
。第2次候補文字絞り部6では、次のような処理が行わ
れる。
ステップS4において、距離差計算部6lにおいて、隣
合う文字の距離の差分を計算する。そして、ステップS
5において、平均並びに分散計算部62で距離差の平均
および分散の計算を行ない1 0 ステップS6に進む。
合う文字の距離の差分を計算する。そして、ステップS
5において、平均並びに分散計算部62で距離差の平均
および分散の計算を行ない1 0 ステップS6に進む。
ステップS6においては、絞り込み可否判定部63で、
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。
上述した所定の距離差のものが存在する場合にはステッ
プS7へ進む。ステップS7では、候補文字分離部64
で、最大の距離差のところで分割し、それ以上の距離の
文字候補は棄却し、そして、動作を終了する。
プS7へ進む。ステップS7では、候補文字分離部64
で、最大の距離差のところで分割し、それ以上の距離の
文字候補は棄却し、そして、動作を終了する。
一方、距離差のものがない場合には、ステップS8へ進
み、第1次候補文字絞り処理で選別された、文字をその
まま候補文字として採用し、そして、動作を終了する。
み、第1次候補文字絞り処理で選別された、文字をその
まま候補文字として採用し、そして、動作を終了する。
(ト)発明の効果
以上説明したように本発明によれば、文字認識精度を損
なうことなくゝ、大幅に候補文字を絞ることができ、修
正時において、使用者の候補文字選択の繁雑さを軽減で
きる。また、認識後処理を行う場合にも、候補文字を減
少させることで、単語照合の組合せの数が減って、処理
の高速化と高精11 度化が可能である。
なうことなくゝ、大幅に候補文字を絞ることができ、修
正時において、使用者の候補文字選択の繁雑さを軽減で
きる。また、認識後処理を行う場合にも、候補文字を減
少させることで、単語照合の組合せの数が減って、処理
の高速化と高精11 度化が可能である。
第1図は本発明の概念図、第2図は本発明の実施例を示
す構成図、第3図は本発明における処理の流れ図である
。 2・・・パターン間距離算出部、3・・・標準パターン
辞書、4・・・距離順並び替え部、5・・一第1次候補
文字絞り部、6・・・第2次候補文字絞り部。 1 2 第 2 図 入力文字パターン 特開平3−161890 (5) 第 3 図 11M&
す構成図、第3図は本発明における処理の流れ図である
。 2・・・パターン間距離算出部、3・・・標準パターン
辞書、4・・・距離順並び替え部、5・・一第1次候補
文字絞り部、6・・・第2次候補文字絞り部。 1 2 第 2 図 入力文字パターン 特開平3−161890 (5) 第 3 図 11M&
Claims (1)
- (1)各文字カテゴリ毎の標準字体をもつ標準パターン
辞書、 入力された文字パターンと上記標準パターン辞書に登録
されている文字種との間の標準パターン間距離を算出す
るパターン間距離算出部、 この算出部にて算出された距離の小さい順に文字を並べ
替える距離順並べ替え部、 候補文字をおおまかに限定する第1次候補文字絞り部、 並べ替え後の隣合う文字の間の距離差を算出する距離差
計算部と距離差の平均並びに分散を計算する平均・分散
計算部と候補文字の絞り込みの可否を判定する絞り込み
可否判定部と最大距離差のところで、候補文字とそれ以
外に分割する候補文字分離部と、を備えてなる第2次候
補文字絞り部、 とを具備し、 距離差の最大となるところを見つけることにより、それ
より距離の小さい文字を候補文字として残し、それ以外
は棄却することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1301248A JP2755738B2 (ja) | 1989-11-20 | 1989-11-20 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1301248A JP2755738B2 (ja) | 1989-11-20 | 1989-11-20 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03161890A true JPH03161890A (ja) | 1991-07-11 |
JP2755738B2 JP2755738B2 (ja) | 1998-05-25 |
Family
ID=17894554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1301248A Expired - Fee Related JP2755738B2 (ja) | 1989-11-20 | 1989-11-20 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2755738B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03257596A (ja) * | 1990-03-07 | 1991-11-18 | Fujitsu Ltd | 認識距離の差に基づく最良優先探索処理方法 |
-
1989
- 1989-11-20 JP JP1301248A patent/JP2755738B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03257596A (ja) * | 1990-03-07 | 1991-11-18 | Fujitsu Ltd | 認識距離の差に基づく最良優先探索処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2755738B2 (ja) | 1998-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4979227A (en) | Method for automatic character recognition employing a lexicon having updated character strings | |
JP2822189B2 (ja) | 文字認識装置及び方法 | |
US5005205A (en) | Handwriting recognition employing pairwise discriminant measures | |
JP3313272B2 (ja) | 住所読み取り方法および識別関数重みベクトル生成方法 | |
JPH10143613A (ja) | パタン認識方法 | |
JPH03161890A (ja) | 文字認識装置 | |
US20040114803A1 (en) | Method of stricken-out character recognition in handwritten text | |
JP2875678B2 (ja) | 文字認識結果の後処理方法 | |
JPS63780A (ja) | パターン認識方法 | |
JPS62257583A (ja) | 文字認識方式 | |
JP4143148B2 (ja) | 文字認識装置 | |
JP2000339470A (ja) | パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体 | |
JPH08101880A (ja) | 文字認識装置 | |
KR930012141B1 (ko) | 온라인 필기체 문자인식방법 | |
JP2510722B2 (ja) | 英文の大文字,小文字の判別方法 | |
JP2658154B2 (ja) | 文字識別方式 | |
JP3595081B2 (ja) | 文字認識方法 | |
JP2658153B2 (ja) | 文字識別方式 | |
JPH07160820A (ja) | 文字認識方法 | |
JPH08272904A (ja) | パターン認識装置 | |
JP3659688B2 (ja) | 文字認識装置 | |
JPH01169588A (ja) | オンライン文字認識装置 | |
JP3446769B2 (ja) | 文字認識装置 | |
JPH08167005A (ja) | 文字認識装置 | |
JPH06187506A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |