JPH03161890A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03161890A
JPH03161890A JP1301248A JP30124889A JPH03161890A JP H03161890 A JPH03161890 A JP H03161890A JP 1301248 A JP1301248 A JP 1301248A JP 30124889 A JP30124889 A JP 30124889A JP H03161890 A JPH03161890 A JP H03161890A
Authority
JP
Japan
Prior art keywords
characters
character
distance
candidate
distance difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1301248A
Other languages
English (en)
Other versions
JP2755738B2 (ja
Inventor
Toru Matsuo
松尾 徹
Kota Fujimura
恒太 藤村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP1301248A priority Critical patent/JP2755738B2/ja
Publication of JPH03161890A publication Critical patent/JPH03161890A/ja
Application granted granted Critical
Publication of JP2755738B2 publication Critical patent/JP2755738B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、文字認識装置に係り、修正作業の簡便化や単
語照合等の後処理の精度を向上させるため、認識候補文
字を最小限に絞り込む文字認識装置に関するものである
(ロ)従来技術 従来の文字認識では、認識結果として、候補文字は定数
個(通常10個程度)に固定されているものがある。ま
た電子情報通信学会論文誌(D)Vol.J71−D 
No.6 ppl037−1047 1988年6月の
論文「情景画像からの文字パターン抽出と認識」に開示
されているように、各文字カテゴリ毎に距離(または類
似度)のしきい値が設定されて、個数可変のものがある
。更に、電子情報通信学会論文誌D−IIVol. J
72−D− II  No.7 pp993−1000
  1989年7月の論文「候補文字補完と言語処理に
よる漢字認識の誤り訂正処理法」に開示されているよう
に、固定しきい値により制限を加えたもの等の種々の方
式によりある程度候補文字は絞られていたが、十分とは
いえなかった。
(ハ)発明が解決しようとする課題 候補文字の数は、選択する側の繁雑さからすると、でき
るだけ少ないことが望ましい。
従来の各方法では候補の絞り込みが十分でなく、修正作
業において、候補選択の際に、ほとんど類似していない
ような文字まで候補に挙がっており、選択が繁雑であっ
た。
また、認識後に単語照合等の後処理にかける場合には、
候補文字が必要以上に多くなるため、組合せの数が増え
ることにより、別の単語と照合されてしまい、正しい結
果が得られないことがあった。
本発明は、上述した従来の問題点に鑑み、認識精度を損
なうことなく候補文字の数を絞り込み、修正作業を容易
に、あるいは後処理を高精度にすることをその課題とす
る。
(二)課題を解決するための手段 本発明は、各文字カテゴリ毎の標準字体をもつ標準パタ
ーン辞書と、入力された文字パターンと上記標準パター
ン辞書に登録されている文字種との間の標準パターン間
距離を算出するパターン間距離算出部と、算出された距
離の小さい順に文字を並べ替える距離順並べ替え部と、
候補文字をおおまかに限定する第1次候補文字絞り部と
、並べ替え後の隣合う文字の間の距離差を算出するとと
もに距離差計算部と距離差の平均並びに分散を計算し、
候補文字の絞り込みの可否を判定しかつ最大距離差のと
ころで、候補文字とそれ以外に分割する第2次候補文字
絞り部とを具備し、 距離差の最大となるところを見つ
けることにより、それより距離の小さい文字を候補文字
として残し、それ以外は棄却することを特徴とする。
(ホ)作用 候補文字を絞り込むことができるかどうかは、距離差の
バラッキが大きいかそうでないかによって決定するため
、類似文字の少ない場合には、類似文字とそうでない文
字との間に明らかな距離差を生じる。したがって、距離
差に候補文字と棄却文字の分離点が求まり、候補は絞ら
れる。逆に、類似文字の多い場合は無理に候補を絞るこ
とは避け、候補文字は全て残されることになる。
以上のように、この発明は、無理なくかつ効果的に候補
文字が絞られる。
(へ)実施例 以下、本発明の一実施例を図面を参照して説明する。
本発明においては、候補文字の絞り込みは、候補文字を
距離の小さい順(類似度の大きい順)に並べた際の、距
離差に基づいて行われる。
まず本発明の概念につき第1図に従い説明する。第1図
は候補文字を距離の小さい順に並べたときの様子を示す
概念図であり、この図においては第1次候補文字を10
個としている。同図では、黒丸が1つの候補文字を表し
、距離を横軸として、距離軸方向の分布を示す。
第1図(a)は距離差にバラツキがある場合を示し、図
中の破線の所で距離差が最大となっている。すなわち、
第3位の文字と第4位の文字の間には有意な距離差があ
り、そこを境に候補文字に含める文字と、棄却すべき文
字のグループとを分離することができる。
また、第1図(b)は、距離差はほぼ同じである場合を
示す。この場合は、第1図(a)の場合にように2つの
グループに分離することは危険である。この場合には、
強制的に候補を絞り込むことは避け、すべての文字を候
補文字として残す。
実際の場合に当てはめてみると、第1図(a)は比較的
類似文字の少ない場合に相当し、第1図(b)は類似文
字が多く存在する場合に相当する。
本発明においては、まず、第l図の(a)の場合である
か、(b)の場合であるかの判定が必要である。
この判定につき、まず説明すると、各候補文字間の距離
差の平均を求め、その値よりも極端に大きいものがある
かどうかを判定基準とする。すなわち、極端に大きいも
のがあれば、候補文字はさらに絞り込み可能であると考
える。もしそうでなければ、これ以上の絞り込みは行わ
ない。
この方式では、候補文字数があらかじめ数文字に限定さ
れている必要がある(第1図では10候補であった)。
このため、第1段階として、従来法を用いて候補文字を
数文字に限定しておく。第2段階では、上記の方式によ
り、その候補文字群の距離差を求め、可能であれば、候
補に含める文字と棄却する文字とに分割を行う。
次に第2図および第3図に従い本発明を更に説明する。
第2図は本発明の構成の一例を示す構成図、第3図は処
理の流れ図を示す。
パターン間距離算出部2では、入力された文字パターン
lと標準パターン辞書3に登録されている文字種全てに
対し、特徴比較を行い標準パターンとのパターン間距離
を算出する。標準パターン辞書3は各文字カテゴリ毎の
標準字体が格納されている。パターン間距離算出部2で
得られた結果すなわち、文字種とその距離値は、距離順
並べ替え部4に与えられる。距離順並べ替え部4では、
第1図に示すように、距離の小さい順に並び替えられる
。そして、並び替えられたデータは第l次候補文字絞り
部5に与えられる。第l次候補文字絞り部5は与えられ
たデータに基づき、数候補に絞る。この処理では、従来
法を用いて候補をおおまかに絞り込む。この処理は、単
に候補文字を定数個(例えば、lO個程度)に絞る程度
でもよいし、あるいは、文字カテゴリ毎にしきい値を設
定することによって候補を絞ってもよい。
続いて、データは第2次候補文字絞り部6に送られる。
第2次候補文字絞り部6は距離差計算部61、平均並び
に分散計算部62、絞り込み可否判定部、および候補文
字分離部64を備え、次のような処理が行われる。
まず、必要であれば距離値の小さい順に並べ替えた後、
(本実施例では第1次候補文字絞り部の時点においてす
でに距離順に並んでいるため第2図では省略してある。
)距離差計算部61にデータが与えられる。距離差計算
部61おいて、隣合う文字の距離の差分を計算する。平
均並びに分散計算部62では、距離差の平均並びに分散
値を計算する。そして、絞り込み可否判定部63では、
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。具体的には、以下の式を
満たす距離差のものが存在する場合には、候補文字分離
部64が、最大の距離差のところで分割し、候補文字と
それ以上の距離の文字候補は棄却する。
(距離差)〉(距離差平均)+(距離差の分散の2倍) もし、上式を満たす距離差のものがない場合には、第1
次候補文字絞り部5で選別された、文字をそのまま候補
文字として採用する。
得られた候補文字は、後処理部7に渡され、単語照合等
の処理が行われる。
また、第2図の例では示していないが、後処理を行わな
い場合には、修正時に次候補文字とじて採用される。
次に本発明の処理手順につき第3図の流れ図に従い説明
する。
ステップS1において、パターン間距離算出部2で、入
力された文字パターンと標準パターン辞書3に登録され
ている文字種全てに対し、特徴比較を行う。
続いて、ステップS2において、ステップS1で得られ
た結果(文字種とその距離値)が、距離順並べ替え部4
で、距離の小さい順に並び替えられる。
ステップS3では、第1次候補文字絞り部5によって数
候補に絞られる。
その後、第2次候補文字絞り部6での処理が行なわれる
。第2次候補文字絞り部6では、次のような処理が行わ
れる。
ステップS4において、距離差計算部6lにおいて、隣
合う文字の距離の差分を計算する。そして、ステップS
5において、平均並びに分散計算部62で距離差の平均
および分散の計算を行ない1 0 ステップS6に進む。
ステップS6においては、絞り込み可否判定部63で、
その平均値と分散とをもとに、距離差の極端に大きいも
のがあるかどうかを判定する。
上述した所定の距離差のものが存在する場合にはステッ
プS7へ進む。ステップS7では、候補文字分離部64
で、最大の距離差のところで分割し、それ以上の距離の
文字候補は棄却し、そして、動作を終了する。
一方、距離差のものがない場合には、ステップS8へ進
み、第1次候補文字絞り処理で選別された、文字をその
まま候補文字として採用し、そして、動作を終了する。
(ト)発明の効果 以上説明したように本発明によれば、文字認識精度を損
なうことなくゝ、大幅に候補文字を絞ることができ、修
正時において、使用者の候補文字選択の繁雑さを軽減で
きる。また、認識後処理を行う場合にも、候補文字を減
少させることで、単語照合の組合せの数が減って、処理
の高速化と高精11 度化が可能である。
【図面の簡単な説明】
第1図は本発明の概念図、第2図は本発明の実施例を示
す構成図、第3図は本発明における処理の流れ図である
。 2・・・パターン間距離算出部、3・・・標準パターン
辞書、4・・・距離順並び替え部、5・・一第1次候補
文字絞り部、6・・・第2次候補文字絞り部。 1 2 第 2 図 入力文字パターン 特開平3−161890 (5) 第 3 図 11M&

Claims (1)

    【特許請求の範囲】
  1. (1)各文字カテゴリ毎の標準字体をもつ標準パターン
    辞書、 入力された文字パターンと上記標準パターン辞書に登録
    されている文字種との間の標準パターン間距離を算出す
    るパターン間距離算出部、 この算出部にて算出された距離の小さい順に文字を並べ
    替える距離順並べ替え部、 候補文字をおおまかに限定する第1次候補文字絞り部、 並べ替え後の隣合う文字の間の距離差を算出する距離差
    計算部と距離差の平均並びに分散を計算する平均・分散
    計算部と候補文字の絞り込みの可否を判定する絞り込み
    可否判定部と最大距離差のところで、候補文字とそれ以
    外に分割する候補文字分離部と、を備えてなる第2次候
    補文字絞り部、 とを具備し、 距離差の最大となるところを見つけることにより、それ
    より距離の小さい文字を候補文字として残し、それ以外
    は棄却することを特徴とする文字認識装置。
JP1301248A 1989-11-20 1989-11-20 文字認識装置 Expired - Fee Related JP2755738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1301248A JP2755738B2 (ja) 1989-11-20 1989-11-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1301248A JP2755738B2 (ja) 1989-11-20 1989-11-20 文字認識装置

Publications (2)

Publication Number Publication Date
JPH03161890A true JPH03161890A (ja) 1991-07-11
JP2755738B2 JP2755738B2 (ja) 1998-05-25

Family

ID=17894554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1301248A Expired - Fee Related JP2755738B2 (ja) 1989-11-20 1989-11-20 文字認識装置

Country Status (1)

Country Link
JP (1) JP2755738B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257596A (ja) * 1990-03-07 1991-11-18 Fujitsu Ltd 認識距離の差に基づく最良優先探索処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257596A (ja) * 1990-03-07 1991-11-18 Fujitsu Ltd 認識距離の差に基づく最良優先探索処理方法

Also Published As

Publication number Publication date
JP2755738B2 (ja) 1998-05-25

Similar Documents

Publication Publication Date Title
US4979227A (en) Method for automatic character recognition employing a lexicon having updated character strings
JP2822189B2 (ja) 文字認識装置及び方法
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPH10143613A (ja) パタン認識方法
JPH03161890A (ja) 文字認識装置
US20040114803A1 (en) Method of stricken-out character recognition in handwritten text
JP2875678B2 (ja) 文字認識結果の後処理方法
JPS63780A (ja) パターン認識方法
JPS62257583A (ja) 文字認識方式
JP4143148B2 (ja) 文字認識装置
JP2000339470A (ja) パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体
JPH08101880A (ja) 文字認識装置
KR930012141B1 (ko) 온라인 필기체 문자인식방법
JP2510722B2 (ja) 英文の大文字,小文字の判別方法
JP2658154B2 (ja) 文字識別方式
JP3595081B2 (ja) 文字認識方法
JP2658153B2 (ja) 文字識別方式
JPH07160820A (ja) 文字認識方法
JPH08272904A (ja) パターン認識装置
JP3659688B2 (ja) 文字認識装置
JPH01169588A (ja) オンライン文字認識装置
JP3446769B2 (ja) 文字認識装置
JPH08167005A (ja) 文字認識装置
JPH06187506A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees