JPH1011541A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH1011541A
JPH1011541A JP8165932A JP16593296A JPH1011541A JP H1011541 A JPH1011541 A JP H1011541A JP 8165932 A JP8165932 A JP 8165932A JP 16593296 A JP16593296 A JP 16593296A JP H1011541 A JPH1011541 A JP H1011541A
Authority
JP
Japan
Prior art keywords
character
recognition
vector
recognition result
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8165932A
Other languages
English (en)
Other versions
JP3805831B2 (ja
Inventor
Misako Suwa
美佐子 諏訪
Yoshinobu Hotsuta
悦伸 堀田
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16593296A priority Critical patent/JP3805831B2/ja
Publication of JPH1011541A publication Critical patent/JPH1011541A/ja
Application granted granted Critical
Publication of JP3805831B2 publication Critical patent/JP3805831B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字パターンに現れる個人差とともに汎用性
を考慮して、正読率を向上することが可能な文字認識装
置を提供する。 【解決手段】 所定数以上の文字が記載された帳票につ
いて、認識対象の文字パターンの特徴ベクトルと汎用の
辞書101に登録された各文字種の特徴ベクトルとを照
合手段102によって照合した結果に基づいて、各文字
パターンを認識する文字認識装置において、照合手段1
02による中間認識結果の文字種ごとに特徴ベクトルを
複数のグループに分類する分類手段111と、各グルー
プについて代表ベクトルを算出する代表ベクトル算出手
段112と、認識対象の各文字パターンに対応する特徴
ベクトルと各グループの代表ベクトルとの距離をそれぞ
れ求める距離算出手段113と、得られた距離に応じ
て、認識対象の各文字パターンの中間認識結果を修正す
る認識結果修正手段114とを備えたことを特徴とす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、発注伝票や注文書
などの多数の文字が記載された帳票の読み取り処理に用
いられる文字認識装置に関するものである。発注伝票な
どの帳票には、多数の文字が記載されるが、記載される
文字のほとんどは数字であり、読み取り対象となる文字
の種類は少ない。その一方、このような帳票では、個々
の数字が果たす役割が非常に大きく、誤認識が発生した
場合の影響が深刻であるため、帳票に記載された全ての
文字を正確に読み取ることが必要とされており、正読率
を向上することが求められている。
【0002】
【従来の技術】図5に、従来の文字認識装置の構成例を
示す。図5において、読み取り処理部401は、帳票に
記載された文字および文字枠を2値画像として読み取
り、この文字枠に基づいて、切り出し処理部402は、
得られた2値画像から記載された各文字を表す文字パタ
ーンを切り出して、特徴抽出部403の処理に供する構
成となっている。
【0003】この特徴抽出部403は、文字パターンの
それぞれについて特徴ベクトルを抽出し、照合処理部4
04は、この特徴ベクトルと辞書405に登録された特
徴ベクトルとを照合し、最も類似した特徴を持つ文字種
を読み取り結果として出力する構成となっている。ここ
で、辞書405には、それぞれの文字種の一般的な特徴
を表す特徴ベクトルとして、多数の筆記者からそれぞれ
集められた文字サンプルのパターンから抽出された特徴
ベクトルの平均値が登録されている。
【0004】このように、多数の筆記者による文字サン
プルを平均化した特徴ベクトルを利用することにより、
帳票の筆記者にかかわらず、文字種に固有の特徴に着目
して文字認識を行うことが可能となり、文字認識装置の
汎用性の向上が図られており、極めて高い認識率が得ら
れている。一方、特定の筆記者による帳票を読み取る場
合には、その筆記者によって記載された文字を表す文字
パターンを予め収集し、これらの文字パターンから抽出
された特徴ベクトルを辞書405に登録し、文字パター
ンに現れる筆記者特有の「癖」を考慮して、文字認識を
行う方法もある。
【0005】
【発明が解決しようとする課題】上述したように、従来
の汎用の文字認識装置は、様々な筆記者から収集したサ
ンプルから得られた特徴ベクトルの平均することによ
り、文字種自身の形状の特徴を抽出しようとしている。
しかしながら、サンプルの平均値はあくまで平均値であ
って、文字種自身の固有の特徴ではない。また、帳票に
記載された文字パターンには、筆記者それぞれの個人差
がときに極めて大きな変形として現れることもある。
【0006】このため、現実の帳票の読み取りの際に
は、文字パターンから抽出された特徴ベクトルが、他の
文字種に対応して辞書405に登録された平均的な特徴
ベクトルに最も近いとされて、誤った認識結果が得られ
る場合もある。例えば、図6(a) に示す文字「4」を表
す文字パターンから特徴ベクトルをそれぞれ抽出した場
合には、その大部分は文字「4」に対応する特徴ベクト
ルに最も近似しているが(図6(b) 参照)、矢印で示し
た文字パターンは、極端に変形してしまったために、む
しろ、図6(c) に示す文字「6」を表す文字パターンに
対応する特徴ベクトルに類似している(図6(b) 参
照)。
【0007】従来の汎用の文字認識装置は、個々の文字
パターンから抽出された特徴ベクトルと辞書の特徴ベク
トルとの照合結果のみを基準として文字を認識している
ので、同一帳票に記載された文字「4」に対応する文字
パターンとの類似性にかかわらず、この文字パターンを
文字「6」であると誤って認識してしまう。このよう
に、従来の汎用の文字認識装置では、個々の文字種固有
の特徴のみに基づいて、文字パターンを認識していたた
めに、「くせ字」のように、文字パターンに現れる個人
差に対応することができなかった。
【0008】一方、筆記者ごとの特徴ベクトルを辞書に
登録する方法では、確かに筆記者に特有の「くせ字」に
対応することが可能であるが、汎用性が極めて低くなっ
てしまう。本発明は、文字パターンに現れる個人差とと
もに汎用性を考慮して、正読率を向上することが可能な
文字認識装置を提供することを目的とする。
【0009】
【課題を解決するための手段】図1は、本発明の原理ブ
ロック図である。請求項1の発明は、所定の数以上の文
字が記載された帳票に対応する画像データを受け取り、
帳票に記載された文字を表す認識対象の文字パターンそ
れぞれの特徴を表す特徴ベクトルと汎用の辞書101に
登録された各文字種の一般的な特徴を示す特徴ベクトル
とを照合手段102によって照合した結果に基づいて、
認識対象の各文字パターンを認識する文字認識装置にお
いて、照合手段102による照合結果に応じて、特徴ベ
クトルが最も類似しているとされた中間認識結果の文字
種ごとに、認識対象の各文字パターンに対応する特徴ベ
クトルを複数のグループに分類する分類手段111と、
複数のグループそれぞれに属する特徴ベクトルに基づい
て、各文字種を中間認識結果とする文字パターンに共通
する特徴を表す代表ベクトルをそれぞれ算出する代表ベ
クトル算出手段112と、認識対象の各文字パターンに
対応する特徴ベクトルと、中間認識結果の各文字種に対
応するグループの代表ベクトルとの距離をそれぞれ求め
る距離算出手段113と、距離算出手段113によって
得られた距離に応じて、認識対象の各文字パターンにつ
いて得られた中間認識結果を修正する認識結果修正手段
114とを備えたことを特徴とする。
【0010】請求項1の発明は、照合手段102によっ
て得られた中間認識結果に基づいて、分類手段111と
代表ベクトル算出手段112とが動作することにより、
認識対象の帳票に記載された文字パターンからそれぞれ
の文字種ごとの特徴を表す代表ベクトルを抽出すること
ができる。これらの代表ベクトルは、帳票の記載者固有
の特徴を反映しているから、これらの代表ベクトルに基
づいて、距離算出手段113および認識結果修正手段1
14が動作することにより、汎用の辞書101を用いて
得られた認識結果を文字パターンに現れる個人差を考慮
して修正することが可能である。
【0011】請求項2の発明は、請求項1に記載の文字
認識装置において、認識結果修正手段114は、各グル
ープの代表ベクトルとの距離を修正対象の文字に対応す
る特徴ベクトルが含まれるグループの代表ベクトルとの
距離によって正規化する正規化手段121と、正規化さ
れた各代表ベクトルとの距離と所定の誤認識判定閾値と
に基づいて、中間認識結果が誤認識である可能性の高い
文字パターンを判別する誤認識判別手段122と、誤認
識である可能性が高いとされた文字パターンについて、
正規化された各代表ベクトルとの距離に基づいて、最終
的な認識結果を決定する決定手段123とを備えた構成
であることを特徴とする。
【0012】請求項2の発明は、正規化手段121で得
られた正規化された各代表ベクトルとの距離を誤認識判
別手段122の処理に供することにより、各代表ベクト
ルとの距離そのものの大小にかかわらず、各代表ベクト
ルで表される文字パターンの特徴と、修正対象の文字パ
ターンの特徴との類似度を評価し、中間認識結果が誤認
識である可能性の高い文字パターンを抽出して、決定手
段123の処理に供することができる。
【0013】請求項3の発明は、請求項2に記載の文字
認識装置において、決定手段123は、正規化された各
代表ベクトルとの距離と所定の相関判定閾値とに基づい
て、修正対象の文字パターンの特徴ベクトルとの間に高
い相関を有する代表ベクトルを判別する相関判別手段1
24と、高い相関を有する代表ベクトルが存在する旨の
判別結果に応じて、修正対象の文字パターンに対応する
中間認識結果を該当する代表ベクトルに対応する文字種
に置換して、最終的な認識結果として出力する置換手段
125とを備えた構成であることを特徴とする。
【0014】請求項3の発明は、相関判別手段124に
よる判別結果に応じて、置換手段125が動作すること
により、筆記者固有の特徴を考慮して、修正対象の文字
パターンの特徴に十分に類似した特徴を持つ文字種を判
別し、中間認識結果を修正することができるので、「く
せ字」による誤認識を修正することが可能である。請求
項4の発明は、請求項3に記載の文字認識装置におい
て、決定手段123は、高い相関を有する代表ベクトル
が存在しない旨の判別結果に応じて、修正対象の文字パ
ターンに対応する中間認識結果を棄却して、認識できな
かった旨を通知する棄却通知手段126を備えた構成で
あることを特徴とする。
【0015】請求項4の発明は、相関判別手段124に
よる判別結果に応じて、棄却通知手段126が動作する
ことにより、筆記者固有の特徴を考慮した場合に、いず
れの文字種とも十分に高い相関が得られない文字パター
ンを抽出し、認識できなかった旨を利用者に通知して、
誤認識を避けることができる。
【0016】
【発明の実施の形態】以下、図面に基づいて、本発明の
実施形態について詳細に説明する。図2は、本発明の文
字認識装置の実施形態を示す図である。図2において、
読み取り処理部401、切り出し処理部402、特徴抽
出部403、照合処理部404および辞書405は、上
述した従来の文字認識装置と同様に照合手段102およ
び辞書102として動作し、照合処理部404による照
合結果を中間認識結果として、誤認識判定処理部210
の処理に供する構成となっている。
【0017】図2に示した誤認識判定処理部210にお
いて、分類処理部211は、分類手段111に相当する
ものであり、上述した特徴抽出部403から各文字パタ
ーンに対応する特徴パターンを受け取って、これらの特
徴パターンを中間認識結果として得られた文字種ごとに
分類し、代表ベクトル算出手段112に相当する代表ベ
クトル算出部212の処理に供する構成となっている。
【0018】この代表ベクトル算出部212は、各文字
種に対応するグループごとに、特徴ベクトルの平均値を
該当する文字に対応する特徴ベクトルの代表値として求
め、各グループに対応する代表ベクトルとして、個別辞
書213に蓄積する構成となっている。この代表ベクト
ルのそれぞれは、帳票の筆記者が該当する文字を記載し
た際の固有の特徴を反映しているから、上述したように
して代表ベクトルを蓄積していくことにより、筆記者固
有の特徴を考慮した個別辞書213を得ることができ
る。
【0019】また、図2において、距離算出部214は
距離算出手段113に相当するものであり、認識対象の
各文字パターンに対応する特徴ベクトルと各文字種に対
応する代表ベクトルとの距離を算出して、認識結果修正
手段114に相当する判別処理部215の処理に供する
構成となっている。ここで、距離算出部214で得られ
る距離は、認識対象の文字パターンの特徴と帳票の筆記
者による各文字種の特徴との類似度を示す指標であるか
ら、判別処理部215は、これらの距離に基づいて、認
識対象の文字パターンについての中間認識結果を確認す
ればよい。
【0020】但し、上述したようにして、代表ベクトル
を求めるためには、各中間認識結果に対応するグループ
に充分な要素が含まれている必要がある。なぜなら、極
端に変形した文字が現れることはまれではあるが、この
ような極端に変形した文字による影響を無視して、帳票
の筆記者が各文字種を記載する際の「癖」を反映する代
表ベクトルを得るためには、各文字種に対応するグルー
プに充分な数の特徴ベクトルによって平均化する必要が
あるからである。
【0021】このため、図2において、判定制御部21
6は、上述した分類処理部211による分類結果を受け
取り、各文字種に対応するグループに属する要素数が所
定の閾値nth以上であるか否かに応じて、上述した代表
ベクトル算出部212、距離算出部214および判別処
理部215の処理を制御し、条件を満たす文字種につい
てのみ、誤認識判別処理を実行する構成とすればよい。
【0022】また、図2に示した判別処理部215にお
いて、距離比算出部221は、正規化手段121に相当
するものであり、認識対象の文字パターンそれぞれにつ
いて、自グループの代表ベクトルとの距離で他の各グル
ープの代表ベクトルとの距離をそれぞれ除して距離比を
求め、最小値検出部222は、各文字パターンについて
得られた距離比の最小値を検出して、比較処理部223
の処理に供する構成となっている。
【0023】この比較処理部223は、最小値検出部2
22から受け取った距離比の最小値と所定の閾値とを比
較し、この比較結果を認識結果決定部224の処理に供
する構成となっている。図3に、誤認識判別動作を表す
流れ図を示す。まず、分類処理部211により、読み取
り対象の文字パターンに対応する特徴ベクトルが、それ
ぞれの中間認識結果に応じて各文字種に対応するグルー
プに分類される(ステップ301)。
【0024】次に、判定制御部216は、中間認識結果
の各文字種について、各グループに属する要素数niが
閾値nth以上であるか否かを順次に判定し(ステップ3
02)、否定判定の場合は、該当するグループに属する
各要素に対応する認識結果として、中間認識結果をその
まま出力して(ステップ303)、ステップ304に進
めばよい。
【0025】一方、ステップ302の肯定判定の場合
は、代表ベクトル算出部212が該当するグループに含
まれる各特徴ベクトルの平均値を算出し(ステップ30
5)、該当する文字種における筆記者固有の特徴を反映
した代表ベクトルとして個別辞書213に登録すればよ
い。次に、判定制御部216は、全ての文字について要
素数の判定および代表ベクトルの算出が終了したか否か
を判定し(ステップ304)、否定判定の場合は、ステ
ップ302に戻って、次の文字についての判定処理を行
う。
【0026】このようにして、上述した条件を満たす全
ての中間認識結果について、代表ベクトルの算出が終了
したときに、ステップ304の肯定判定となり、これら
の中間認識結果ごとに分類された各特徴ベクトルについ
て、ステップ306以下の判別処理が行われる。まず、
距離算出部214により、ステップ302で充分な要素
数があるとされたグループに属する特徴ベクトルについ
て、順次に、各グループG1〜Gnの代表ベクトルV1〜Vnと
の距離D1〜Dnが算出される(ステップ306)。
【0027】次に、判別処理部215の距離比算出部2
21は、これらの距離D1〜Dnのそれぞれを自グループGi
の代表ベクトルViとの距離Diで除して距離比P1〜Pnを求
め(ステップ307、式(1) 参照)、最小値検出部22
2に送出すればよい。 Pk=Dk/Di ・・・(1) これに応じて、最小値検出部222は、受け取った距離
比P1〜Pnから最小値Pjを検出し(ステップ308)、こ
の最小値Pjが、比較処理部223の処理に供される。
【0028】ここで、上述したようにして、距離比P1〜
Pnを求めることにより、各代表ベクトルV1〜Vnとの距離
D1〜Dnの値にかかわらず、筆記者固有の特徴を考慮した
各文字種の特徴と認識対象の文字の特徴との類似度を示
す指標を得ることができる。例えば、図4(a),(b) に示
すように、認識対象の特徴ベクトルと中間認識結果とし
て得られた文字iの代表ベクトルとの距離と文字xおよ
び文字yに対応する代表ベクトルVx、Vyとの距離の差が
等しい場合は、距離そのものに着目したのでは同等に近
いとされてしまう。これに対して、距離比を用いれば、
図4(a) に示した文字xに対応する代表ベクトルVxは、
文字iに対応する代表ベクトルViに比べて明らかに認識
対象の特徴ベクトルとの類似度が高いと判断でき、その
一方、図4(b) に示した文字yに対応する代表ベクトル
Vyおよび文字iに対応する代表ベクトルViと認識対象の
特徴ベクトルとの類似度は同程度であると判断すること
ができる。
【0029】また、上述したステップ308で得られた
最小値Pjは、認識対象の文字に最も近い代表ベクトルを
持つ文字種との類似度を示しているから、この最小値Pj
の値によって、中間認識結果の正当性および筆記者固有
の特徴を考慮した場合の最終的な認識結果を判断するこ
とが可能である。例えば、まず、比較処理部223によ
り、最小値検出部222から受け取った最小値Pjと誤認
識判定閾値Thc と比較し、最小値Pjが誤認識判定閾値Th
c (例えば、Thc =1)よりも大きいとされた場合(ス
テップ309の否定判定)に、認識結果決定部224
が、中間認識結果は正当であると判断すればよい。
【0030】この場合は、該当する文字パターンに最も
類似している代表ベクトルは、中間認識結果に対応する
代表ベクトルであるから、この中間認識結果をそのまま
最終的な認識結果として出力し(ステップ310)、こ
の文字パターンについての誤認識判定処理を終了して、
ステップ311に進めばよい。
【0031】一方、ステップ309の肯定判定の場合
は、中間認識結果に対応する代表ベクトルよりも類似度
の高い代表ベクトルが存在するので、この中間認識結果
が誤っている可能性が高いと判断することができる。こ
のように、最小値検出部222で得られた距離比の最小
値に応じて、比較処理部223と認識結果決定部224
が動作することにより、請求項2で述べた誤認識判別手
段122の機能を実現し、誤認識の可能性が高い文字パ
ターンについてのみ、後述する修正処理を行うことがで
きる。
【0032】この場合は、比較処理部223により、更
に、誤認識判定閾値Thc よりも小さい値を持つリジェク
ト閾値Thr と上述した最小値Pjとを比較し、最小値Pjが
リジェクト閾値Thr 以下である場合(ステップ312の
肯定判定)に、認識結果決定部224は、認識対象の文
字パターンがこの最小値Pjを与える文字に充分に類似し
ていると判断すればよい。
【0033】この場合は、該当する文字パターンに対応
する認識結果を最小値Pjに対応する文字に置き換えて、
最終的な認識結果として出力し(ステップ313)、こ
の文字パターンについての誤認識判定処理を終了して、
ステップ311に進めばよい。このように、比較処理部
223による比較結果に応じて、認識結果決定部224
が動作することにより、請求項3で述べた置換手段12
5の機能を実現し、文字パターンに現れた筆記者固有の
特徴による誤認識を訂正することができる。
【0034】また一方、ステップ312の否定判定の場
合に、認識結果決定部224は、認識対象の文字パター
ンは、いずれの代表ベクトルにも十分に類似していない
と判断すればよい。この場合は、認識結果決定部224
は請求項4で述べた棄却通知手段126として動作し、
中間認識結果を破棄して、認識不能である旨を最終的な
認識結果として出力し(ステップ314)、この文字パ
ターンについての誤認識判定処理を終了して、ステップ
311に進めばよい。
【0035】また、ステップ311において、判定制御
部216は、対象となった全ての文字パターンについ
て、上述した誤認識判定処理が終了したか否かを判定し
(ステップ311)、否定判定の場合は、ステップ30
6に戻って次の文字パターンについての処理を開始し、
肯定判定の場合に、文字パターンの認識処理を終了すれ
ばよい。
【0036】このようにして、帳票から切り出された文
字パターンに現れた筆記者固有の特徴を考慮して、汎用
の辞書403を用いて得られた中間認識結果を補正する
ことが可能となるから、筆記者の「癖」などに柔軟に対
応し、正読率を更に向上することができる。この場合
は、同一帳票に記載された他の文字との類似性を利用し
て個別辞書213を作成しているので、筆記者ごとに予
め個別辞書を用意する作業は不要であり、文字認識装置
の汎用性を保ちつつ、文字パターンに現れる個人差に対
応して、極端に変形した文字パターンとして正しい認識
結果を得ることが可能となる。
【0037】また、特に、類似度を示す指標として距離
比を用い、この距離比とリジェクト閾値との比較結果に
応じてステップ312からステップ314の処理を行う
ことにより、誤認識の可能性がある文字パターンが、明
らかに中間認識結果とは別の文字種に類似しているか、
あるいは、全ての文字種との類似性があやふやであるの
かを判別し、それぞれに適切な処理を行うことが可能で
ある。
【0038】これにより、類似性があやふやな文字パタ
ーンについての最終的な認識結果の決定を避け、該当す
る文字パターンの認識を利用者に委ねることができ、ま
た、類似性が確実である場合にのみ、認識結果の変更を
行うことができるので、誤った認識結果を出力する可能
性を削減することができる。
【0039】
【発明の効果】以上に説明したように、本発明によれ
ば、帳票上に多数記載された各文字の文字パターンか
ら、それぞれの文字種ごとに帳票の筆記者固有の特徴を
反映した代表ベクトルを抽出し、これらの代表ベクトル
に基づいて、中間認識結果を必要に応じて修正すること
ができるので、文字認識装置の汎用性を保ちつつ、文字
パターンに現れる筆記者固有の特徴に柔軟に対応し、認
識率を向上することができる。
【0040】特に、請求項2の発明によれば、各代表ベ
クトルとの距離そのものの大小にかかわらず、修正対象
の文字パターンの特徴と各グループの代表ベクトルで表
される特徴との近似の度合いを評価し、中間認識結果が
誤認識である可能性が高い文字パターンを漏れなく抽出
することができるので、認識結果の信頼性を向上するこ
とができる。
【0041】また、請求項3の発明によれば、帳票の筆
記者固有の特徴を考慮して、修正対象の文字パターンに
充分に高い相関を有する文字種を判別し、中間認識結果
を訂正することができるから、文字パターンに現れる個
人差による誤認識を削減し、正読率を向上することがで
きる。また一方、請求項4の発明によれば、相関があや
ふやな中間認識結果を排除して、利用者の判断に委ねる
ことができるから、文字パターンに現れる個人差による
誤認識を削減し、誤認識によって生じる損害を防ぐこと
ができる。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の文字認識装置の実施形態を示す図であ
る。
【図3】誤認識判別動作を表す流れ図である。
【図4】距離比による類似度判定を説明する図である。
【図5】従来の文字認識装置の構成例を示す図である。
【図6】くせ字による誤認識を説明する図である。
【符号の説明】
101、405 辞書 102 照合手段 111 分類手段 112 代表ベクトル算出手段 113 距離算出手段 114 認識結果修正手段 121 正規化手段 122 誤認識判別手段 123 決定手段 124 相関判別手段 125 置換手段 126 棄却通知手段 210 誤認識判定処理部 211 分類処理部 212 代表ベクトル算出部 213 個別辞書 214 距離算出部 215 判別処理部 216 判定制御部 221 距離比算出部 222 最小値検出部 223 比較処理部 224 認識結果決定部 401 読み取り処理部 402 切り出し処理部 403 特徴抽出部 404 照合処理部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 所定の数以上の文字が記載された帳票に
    対応する画像データを受け取り、前記帳票に記載された
    文字を表す認識対象の文字パターンそれぞれの特徴を表
    す特徴ベクトルと汎用の辞書に登録された各文字種の一
    般的な特徴を示す特徴ベクトルとを照合手段によって照
    合した結果に基づいて、前記認識対象の各文字パターン
    を認識する文字認識装置において、 前記照合手段による照合結果に応じて、特徴ベクトルが
    最も類似しているとされた中間認識結果の文字種ごと
    に、前記認識対象の各文字パターンに対応する特徴ベク
    トルを複数のグループに分類する分類手段と、 前記複数のグループそれぞれに属する特徴ベクトルに基
    づいて、前記各文字種を中間認識結果とする文字パター
    ンに共通する特徴を表す代表ベクトルをそれぞれ算出す
    る代表ベクトル算出手段と、 前記認識対象の各文字パターンに対応する特徴ベクトル
    と、前記中間認識結果の各文字種に対応するグループの
    代表ベクトルとの距離をそれぞれ求める距離算出手段
    と、 前記距離算出手段によって得られた距離に応じて、前記
    認識対象の各文字パターンについて得られた中間認識結
    果を修正する認識結果修正手段とを備えたことを特徴と
    する文字認識装置。
  2. 【請求項2】 請求項1に記載の文字認識装置におい
    て、 認識結果修正手段は、 各グループの代表ベクトルとの距離を修正対象の文字に
    対応する特徴ベクトルが含まれるグループの代表ベクト
    ルとの距離によって正規化する正規化手段と、 正規化された各代表ベクトルとの距離と所定の誤認識判
    定閾値とに基づいて、中間認識結果が誤認識である可能
    性の高い文字パターンを判別する誤認識判別手段と、 誤認識である可能性が高いとされた文字パターンについ
    て、前記正規化された各代表ベクトルとの距離に基づい
    て、最終的な認識結果を決定する決定手段とを備えた構
    成であることを特徴とする文字認識装置。
  3. 【請求項3】 請求項2に記載の文字認識装置におい
    て、 決定手段は、 正規化された各代表ベクトルとの距離と所定の相関判定
    閾値とに基づいて、修正対象の文字パターンの特徴ベク
    トルとの間に高い相関を有する代表ベクトルを判別する
    相関判別手段と、 高い相関を有する代表ベクトルが存在する旨の判別結果
    に応じて、修正対象の文字パターンに対応する中間認識
    結果を該当する代表ベクトルに対応する文字種に置換し
    て、最終的な認識結果として出力する置換手段とを備え
    た構成であることを特徴とする文字認識装置。
  4. 【請求項4】 請求項3に記載の文字認識装置におい
    て、 決定手段は、高い相関を有する代表ベクトルが存在しな
    い旨の判別結果に応じて、修正対象の文字パターンに対
    応する中間認識結果を棄却して、認識できなかった旨を
    通知する棄却通知手段を備えた構成であることを特徴と
    する文字認識装置。
JP16593296A 1996-06-26 1996-06-26 文字認識装置 Expired - Fee Related JP3805831B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16593296A JP3805831B2 (ja) 1996-06-26 1996-06-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16593296A JP3805831B2 (ja) 1996-06-26 1996-06-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPH1011541A true JPH1011541A (ja) 1998-01-16
JP3805831B2 JP3805831B2 (ja) 2006-08-09

Family

ID=15821760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16593296A Expired - Fee Related JP3805831B2 (ja) 1996-06-26 1996-06-26 文字認識装置

Country Status (1)

Country Link
JP (1) JP3805831B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9668748B2 (en) 2009-05-29 2017-06-06 Smith & Nephew, Inc. Methods and apparatus for performing knee arthroplasty
US9730712B2 (en) 2012-10-18 2017-08-15 Smith & Nephew, Inc. Alignment devices and methods

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9668748B2 (en) 2009-05-29 2017-06-06 Smith & Nephew, Inc. Methods and apparatus for performing knee arthroplasty
US9730705B2 (en) 2009-05-29 2017-08-15 Smith & Nephew, Inc. Methods and apparatus for performing knee arthroplasty
US9848888B2 (en) 2009-05-29 2017-12-26 Smith & Nephew, Inc. Methods and apparatus for performing knee arthroplasty
US9730712B2 (en) 2012-10-18 2017-08-15 Smith & Nephew, Inc. Alignment devices and methods
US10499933B2 (en) 2012-10-18 2019-12-10 Smith & Nephew, Inc. Alignment devices and methods
US10980551B2 (en) 2012-10-18 2021-04-20 Smith & Nephew, Inc. Alignment devices and methods
US11039844B2 (en) 2012-10-18 2021-06-22 Smith & Nephew, Inc. Alignment devices and methods
US11039843B2 (en) 2012-10-18 2021-06-22 Smith & Nephew, Inc. Alignment devices and methods

Also Published As

Publication number Publication date
JP3805831B2 (ja) 2006-08-09

Similar Documents

Publication Publication Date Title
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
US20120070073A1 (en) Searching document images
US11132576B2 (en) Text recognition method and apparatus, electronic device, and storage medium
US7136526B2 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
JP2000155803A (ja) 文字読取方法および光学式文字読取装置
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
JP2898562B2 (ja) ナンバープレート決定方法
Chatelain et al. Segmentation-driven recognition applied to numerical field extraction from handwritten incoming mail documents
JP3805831B2 (ja) 文字認識装置
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2005250786A (ja) 画像認識方法
JPH0749926A (ja) 文字認識装置
JP3374762B2 (ja) 文字認識方法及びその装置
JP4377283B2 (ja) 特徴抽出装置、特徴抽出方法、および、プログラム
JP3428504B2 (ja) 文字認識装置
JP3006823B2 (ja) 文字および単語の認識方式
JPH06231310A (ja) 文字認識装置における文字認識方法
JPH11203413A (ja) 類似カテゴリ識別辞書作成装置および方法
JPH01191992A (ja) 文字認識装置
JPH1131195A (ja) 文字認識装置、文字認識方法、及び、記憶媒体
JPH0467277A (ja) パターン認識辞書作成装置
JP2002222389A (ja) 追加テンプレートの作成方法、追加テンプレートの作成をコンピュータにより実現させるプログラムおよびocr認識辞書作成装置
JP2002074269A (ja) 文字認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees