JPH07146912A - 文字読取方法および装置 - Google Patents

文字読取方法および装置

Info

Publication number
JPH07146912A
JPH07146912A JP5292223A JP29222393A JPH07146912A JP H07146912 A JPH07146912 A JP H07146912A JP 5292223 A JP5292223 A JP 5292223A JP 29222393 A JP29222393 A JP 29222393A JP H07146912 A JPH07146912 A JP H07146912A
Authority
JP
Japan
Prior art keywords
character
unreadable
category
pattern
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5292223A
Other languages
English (en)
Other versions
JP3419418B2 (ja
Inventor
Sueji Miyahara
末治 宮原
Minako Sawaki
美奈子 澤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP29222393A priority Critical patent/JP3419418B2/ja
Publication of JPH07146912A publication Critical patent/JPH07146912A/ja
Application granted granted Critical
Publication of JP3419418B2 publication Critical patent/JP3419418B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 オペレータが読取り誤り文字の検出と修正を
容易に、かつ効率よく行なえるようにする。 【構成】 読取不能文字判定部11は、読取結果の中か
ら読取不能の文字を検出し、表示部15に文字イメージ
と候補文字とを表示してオペレータに確認修正を求め
る。オペレータは、読取不能文字の中で第1候補が誤っ
ている文字は正しい文字に修正する。読取不能文字がな
くなった段階で、誤り文字検出と修正の処理に移る。誤
り文字検出部12では、特定のカテゴリに確定された読
取不能文字の特徴と確認結果の文字の特徴とを照合し
て、既存の認識辞書より近い距離に位置するものを誤り
文字の候補として検出し、同一カテゴリに属するものを
距離値の近い順にまとめて表示部15に表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、書面上の文字を光学的
に読取ってコード情報に変換する光学的文字読取方法お
よび装置に関する。
【0002】
【従来の技術】従来、この種の文字読取装置において、
誤り文字を検出するためにはオペレータが文字読取結果
を文字イメージと対応づけながら1文字づつ目視によっ
て確認していき、誤り文字を検出した時点で、1文字づ
つ修正を行なっていた。また、読取不能文字が発生した
場合には、言語処理を施して正解パターンに訂正する
か、あるいはそのままオペレータに提示してオペレータ
に確認・修正してもらうかのいずれかの方法が採られて
いた。
【0003】
【発明が解決しようとする課題】上述した従来の文字読
取装置においては、読み取り誤り文字の検出とその修正
とをオペレータが1文字づつ行なっていたため、オペレ
ータは多くの時間を費やすとともに、大きな疲労感を受
けていた。
【0004】また、上述した従来の文字読取装置におい
ては、読取不能文字の訂正を言語処理技術やオペレータ
に頼っていたため、言語処理に頼る方法は、読取対象の
文章の内容が変わった場合には訂正できない場合が生じ
ること、また、オペレータに頼る方法は、多大な時間と
労力を要し、データ入力の経費の上昇を招くと言う問題
が生じていた。
【0005】本発明の目的は、オペレータが読み取り誤
り文字の検出と修正とを容易に、かつ効率よくできる文
字読取方法および装置を提供することにある。
【0006】本発明の他の目的は、文字認識で発生する
読取不能文字を正解パターンに自動的に訂正する文字読
取方法および装置を提供することにある。
【0007】
【課題を解決するための手段】本発明の第1の文字読取
方法は、読み取られた文字パターンの中から一定値以上
の確度で変換できなかった文字パターンを読取不能文字
とする読取不能文字判定ステップと、前記読取不能文字
の中の誤り文字をオペレータが修正した後に、確認修正
された読取不能文字を用いて、誤り文字を検出する誤り
文字検出ステップと、前記読取不能文字の文字イメージ
と候補文字をオペレータに提示し、また前記誤り文字を
カテゴリごとにまとめてオペレータに提示する文字パタ
ーン表示制御ステップとを有する。
【0008】本発明の第1の文字読取装置は、表示部
と、読み取られた文字パターンの中から一定値以上の確
度で変換できなかった文字パターンを読取不能文字とす
る読取不能文字判定手段と、オペレータが確認修正した
読取不能文字の特徴と読取結果の文字パターンの特徴と
を照合して、読取不能文字の特徴から距離値が一定範囲
内にある文字パターンを誤り文字の候補として検出する
誤り文字検出手段と、前記読取不能文字の文字イメージ
と候補文字を前記表示部に表示し、誤り文字の候補とし
て検出された文字パターンを同一カテゴリごとにまとめ
て前記表示部に表示する文字パターン表示制御手段とを
有する。
【0009】本発明の第2の文字読取方法は、読み取ら
れた文字パターンの中から一定値以上の確度で変換でき
なかった文字パターンを読取不能文字とする読取不能文
字検出ステップと、該読取不能文字の近傍の一定の領域
内に存在する正解パターン群を検出する領域内正解パタ
ーン検出ステップと、該領域内正解パターン群が単一カ
テゴリの場合には、その正解カテゴリの対抗カテゴリ群
を設定すると共に、それら対抗カテゴリ群の正解パター
ンが全て前記領域外に存在することを確認し、該読取不
能文字を領域内の正解パターンと同一カテゴリとみなし
て該読取不能文字を訂正する領域外正解パターン検出ス
テップとを有する。
【0010】本発明の第2の文字読取装置は、読み取ら
れた文字パターンの中から一定値以上の確度で変換でき
なかった文字パターンを読取不能文字とする読取不能文
字検出手段と、該読取不能文字の近傍の一定の領域内に
存在する正解パターン群を検出する領域内正解パターン
検出手段と、該領域内正解パターン群が単一カテゴリの
場合には、その正解カテゴリの対抗カテゴリ群を設定す
ると共に、それら対抗カテゴリ群の正解パターンが全て
前記領域外に存在することを確認し、該読取不能文字を
領域内の正解パターンと同一カテゴリとみなして該読取
不能文字を訂正する領域外正解パターン検出手段とを有
する。
【0011】
【作用】図6は請求項1,4の発明の原理の説明図であ
る。分布A,分布BはそれぞれカテゴリA,カテゴリB
の文字パターンが入力文字パターンとして多数読み取ら
れたときの認識結果の距離値の分布を示したもので、カ
テゴリAの認識辞書の中心GA (平均特徴ベクトル)
と、カテゴリBの認識辞書の中心GB との関係が図示し
たようになっている場合、正解文字は領域Cで示された
部分、読取不能文字は領域Rで示された部分、誤り文字
は領域Eで示された部分である。
【0012】このような状態で、読取不能文字(領域R
に出現したカテゴリAの文字)を検出してディスプレイ
画面上に表示し、オペレータが修正した後に、その検出
した文字や修正した文字を手がかりに誤り文字(領域E
に出現するカテゴリAの文字)を自動的に検出すること
ができるので、ディスプレイ画面上に検出した結果をカ
テゴリ毎にまとめて表示すれば、オペレータは読取結果
の全文字を確認するよりも少ない確認量で誤り文字の検
査と修正ができる。
【0013】図10は請求項7,8の発明の原理の説明
図である。分布A,分布BはそれぞれカテゴリA,カテ
ゴリBの文字パターンが入力文字パターンとして多数読
み取られたときの認識結果の特徴の分布を示したもの
で、カテゴリAの認識辞書の中心GA (平均特徴ベクト
ル)と、カテゴリBの認識辞書の中心GB との関係が、
図示したようになっているとすると、正解文字は領域C
で示された部分、読取不能文字は領域Rで示された部
分、誤り文字は領域Eで示された部分である。
【0014】このような状態で、読取不能文字(領域R
に出現したカテゴリAの文字パターン)を検出した場
合、そのパターンから一定領域内(図中破線で示す円
内)に正解文字としてカテゴリAのみが存在し、対抗カ
テゴリであるカテゴリBの正解文字が前記領域外にのみ
存在すれば、該読取不能文字をカテゴリAと見なして自
動的に訂正してやれば、認識結果として正解パターンが
増して読取不能文字が少なくなる。
【0015】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0016】図1は本発明の第1の実施例の文字読取装
置のブロック図、図2はその動作を示すフローチャー
ト、図3は表示部15に表示された注目カテゴリの文字
と誤り文字検出によって検出された誤り文字候補のイメ
ージ群を示す図、図4は図3に示された表示中のイメー
ジ群に属さないと指示された文字イメージが斜線表示さ
れている状態を示す図である。
【0017】文字認識部2は、入力部1から入力された
文字画像を1文字づつの文字パターンに切り出すととも
に、その文字を認識して得られた結果(ここでは候補文
字と、認識結果の確信度を示す距離値)、文字イメージ
と文字の特徴とを後処理部3Aの中の認識結果等格納部
10に送出する。
【0018】後処理部3Aは、読取不能文字判定部11
において認識結果等格納部10の中の文字パターンデー
タが確信を持てる結果であるか否かの判定を行ない、読
取不能文字に対して確認修正部4の文字パターン表示制
御部14内を通して確認修正部4の表示部15に文字イ
メージと認識結果とを表示し、誤っている文字について
はオペレータが修正できるようにする。なお、読取不能
文字の判定には、たとえば、候補文字の第1位の距離値
と第2位の距離値の差が小さい文字パターンを読取不能
文字とする方法を用いればよい。次に、誤り文字検出部
12では、オペレータが確認修正した読取不能文字の文
字パターンの特徴をキーにして、認識結果等格納部10
の中の文字パターンの特徴と照合し、距離値の近い文字
パターンを誤り文字の候補として抽出する。
【0019】確認修正部4は、誤り文字検出部12から
送られてきた情報に基づいて、誤り文字候補の文字パタ
ーンを文字パターン表示制御部14に送る。文字パター
ン表示制御部14では送られてきた文字パターンをカテ
ゴリごとに、かつ距離値の近いものから順にまとめて、
表示部15に図3のような表示レイアウトで表示する。
図3は、注目カテゴリの文字31と、そのカテゴリと同
じカテゴリと見なされた誤り文字候補の文字イメージ3
2,33,・・・・,39,・・・・とを同一画面上に表示した
ものであり、オペレータは修正情報入力部16より図4
に示すように注目カテゴリの文字31と同一カテゴリで
ない文字イメージ39(図中斜線で示す)を指示する。
これにより残った文字イメージ32,33,・・・・に対応
する文字イメージが注目カテゴリの文字31と同じカテ
ゴリであることが分かる。
【0020】次に、図1の実施例の動作について図2の
フローチャートおよび図3の表示部15の表示を示す図
を参照して説明する。
【0021】読取不能文字判定部11は、認識結果等格
納部10中の、文字認識部2によって文字認識された認
識結果の中から読取不能の文字を検出し(ステップ2
2)、表示部15の画面上に文字イメージと候補文字と
を表示してオペレータに確認修正を求める。オペレータ
は、読取不能文字の中で第1候補が誤っている文字は正
しい文字に修正する(ステップ23)。読取不能文字が
なくなった段階で、誤り文字検出と修正の処理に移る。
誤り文字検出部12では、特定のカテゴリに確定された
読取不能文字の特徴と確認結果の文字の特徴とを照合し
て、既存の認識辞書より近い距離に位置するものを誤り
文字の候補として検出し(ステップ24)、同一カテゴ
リに属するものを距離値の近い順にまとめて(ステップ
25)、図3に示すような表示で表示部15に表示す
る。オペレータは注目カテゴリの文字と誤り文字の候補
の文字イメージ32,33,・・・・,39とを目視で比較
し、異なるカテゴリの文字イメージが混入している場合
には、この文字イメージを表示部15の画面上に指示し
て除去を文字パターン表示制御部14に指示する(ステ
ップ26)。この誤り文字の検出と修正とを繰り返して
行ない(ステップ27)、誤り文字の修正が一度も出現
しなくなった時点で処理を終了する。すなわち、図3に
おいて、注目カテゴリの文字31の「犬」が基準にな
り、この基準と同一カテゴリに属するものと判断された
文字パターンの文字イメージ32,33,・・・,3
9,・・・の「犬」,「犬」,・・・,「大」,・・・
が誤り文字候補の文字イメージとして表示される。
【0022】この表示に対してオペレータは図4に示す
ようにカテゴリ「犬」に属さない文字イメージ39
「大」を指示すれば、残りの文字パターン32,33,
・・・・はカテゴリ「犬」として修正されたことになる。
【0023】図5は本発明の第2の実施例の文字読取装
置のブロック図である。本実施例は後処理部3Bに読取
不能カテゴリ登録部13を設けたものである。入力部1
から読み取られる書画像内の文字フォントの種類によっ
ては、文字認識結果のカテゴリの分布が図7に示すよう
な状態になる文字パターンが存在する。このような場合
を仮定して、本実施例では誤りが発生しそうなカテゴリ
を読取不能カテゴリ登録部13に予め登録しておき、オ
ペレータが確認した後に、読取結果として出力部5から
送出するようにする。たとえばカタカナのタ「タ」と漢
字のユウ「夕23」や、数字のゼロ「0」と英字のオー
「O」などがその例として上げられる。このような場合
は読取不能カテゴリ登録部13にそれらのカテゴリを登
録しておき、登録カテゴリと同じ認識結果が出力された
とき、それらをオペレータに直接提示したり、それらを
蓄積して一定の個数が集まってから、お互いの文字パタ
ーンを比較・評価して、文字パターン間で距離の遠いも
のが最初に比較できるように代表文字イメージとし、そ
の代表イメージに近い文字パターンから遠いものへの順
に並べて文字イメージ群を一度に表示し、オペレータの
確認と修正を求める。オペレータは文字パターン群の中
からカテゴリの異なりを検出し、その異なりの境界とそ
のカテゴリ名を指定することによって読取不能カテゴリ
の文字を正解文字に確定することができる。なお、以後
に続く誤り文字の検出・修正は、第1の実施例と同じ方
法で行なうことができる。
【0024】図8は本発明の第3の実施例の文字読取装
置のブロック図、図9はその動作を示すフローチャート
である。
【0025】文字認識部2は、入力部1から入力された
書画像の中から1文字づつの文字パターンに切り出すと
ともに、その文字を認識して得られた結果(ここでは候
補文字と、候補文字の確信度を示す距離値)と、文字イ
メージ、文字の特徴などの情報を後処理部3Cの中の認
識結果等格納部17に送出する。
【0026】後処理部3Cの中の読取不能文字検出部1
8は、認識結果等格納部17のデータに対して読取不能
であるか否かの判定を行なう。読取不能文字の検出に
は、たとえば、候補文字の第1位の距離値と第2位の距
離値の差が小さいものを読取不能文字とする方法を用い
ることができる。次に、領域内正解パターン検出部19
は、読取不能文字から最も近い位置にある認識辞書から
の距離よりも近い所に正解文字パターンが存在し、その
文字パターンがすべて同一のカテゴリであるか否かを判
定し、同一カテゴリであれば、そのカテゴリを読取不能
文字の正解カテゴリ候補と見なして次の処理へ移る。領
域外正解パターン検出部20は、該読取不能文字の候補
文字の中から第n位候補の距離値と第1位候補の距離値
との差が読取不能文字検出用の判定閾値dthより小さ
い値を示すものを対抗カテゴリとして検出し、対抗カテ
ゴリとして設定する。次に、該読取不能文字からの距離
値が認識辞書からの距離値よりも遠い所(領域外)に、
対抗カテゴリの正解カテゴリがすべて存在するか否かを
調べ、全ての正解カテゴリが存在する場合は、読取不能
文字を領域内の正解パターンと同一カテゴリと見なして
訂正し、出力部4から出力する。
【0027】次に、図8の実施例の動作について、図9
のフローチャートを参照して説明する。
【0028】読取不能文字検出部18は、文字認識部2
によって文字認識された(ステップ41)認識結果や文
字イメージ、およびその特徴を蓄積した認識結果等格納
部17の中から候補1位の距離値di1と2位の距離値
di2との差が一定の閾値dthより小さいもの、すな
わち、式(1)の条件に適合するものを読取不能文字P
iとして検出する(ステップ42)。
【0029】 di2−di1<dth ・・・ (1) 次に、読取不能文字Piの近くに正解パターンが存在す
るか否かと、それが特定できるか否かを調べる。すなわ
ち、図10に示すように、読取不能文字Piに最も近い
認識辞書からの距離値di1と読取不能文字Piからの
距離値r1iとの関係が式(2)のような関係にある正
解パターン(領域内正解パターン)が存在し(ステップ
43)、それが同一のカテゴリのみから成っていれば読
取不能文字を正解パターンと同一のカテゴリの可能性が
あるものとして次の処理へ移る(ステップ44)。
【0030】 (r1i/di1)<α ・・・ (2) ここで、αは通常0.5から2.0の間の値をとれば十
分である。
【0031】このとき、読取不能文字の候補文字の中
で、候補1位の距離値との差が閾値dthより小さいも
のを読取不能文字の対抗カテゴリとして設定する(ステ
ップ45)。次に、(r1i/di1)≧αを満足する
ような正解カテゴリの中に対抗カテゴリが存在するか否
かを判定する(ステップ46)。対抗カテゴリの全てに
対して正解カテゴリが存在すれば、読取不能文字を領域
内正解カテゴリと見なして訂正し(ステップ47)、そ
の結果を出力する。
【0032】
【発明の効果】以上説明したように、本発明は以下に示
すような効果がある。 (1)請求項1と4の発明は、読取不能文字を確認修正
した後、その情報を用いて誤り文字を検出しているの
で、オペレータは少ない誤り文字候補の文字パターンを
検査することによって誤り文字を検出、修正できる。 (2)請求項2と5の発明は、検出された誤り文字につ
いては、注目カテゴリの文字と誤り文字候補の文字イメ
ージ群とを同時に表示するようにしているので、誤り文
字を連続して検査し、修正できる。 (3)請求項3と6の発明は、類似文字パターンについ
ては読取不能カテゴリとして予め登録することによっ
て、その誤り易い文字を検出できる。 (4)請求項7と8の発明は、読取不能文字を検出した
場合、そのパターンから一定領域内に正確文字としてカ
テゴリAのみが存在し、対抗カテゴリであるカテゴリB
の正解文字が全て領域外にのみ存在すれば、読取不能文
字をカテゴリAと見なして自動的に訂正することによ
り、読取不能文字を精度よく正解文字に訂正できるの
で、文字認識装置の認識精度を向上させることができ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例の文字読取装置のブロッ
ク図である。
【図2】図1の実施例の動作を示すフローチャートであ
る。
【図3】図1の実施例において表示部5に表示されたイ
メージ群およびその候補文字を示す図である。
【図4】図3で示された表示中のイメージ群に属さない
と指示された文字イメージが斜線表示されている状態を
示す図である。
【図5】本発明の第2の実施例の文字読取装置のブロッ
ク図である。
【図6】請求項1と4の発明の原理の説明図である。
【図7】本発明の中で誤り文字の発生を示す説明図であ
る。
【図8】本発明の第2の実施例の文字読取装置のブロッ
ク図である。
【図9】図8の実施例の動作を示すフローチャートであ
る。
【図10】請求項7と8の発明の原理の説明図である。
【符号の説明】
1 入力部 2 文字認識部 3A,3B,3C 後処理部 4 認識修正部 5 出力部 10,20 認識結果等格納部 11 読取不能文字判定部 12 誤り文字検出部 13 読取不能カテゴリ登録部 14 文字パターン表示制御部 15 表示部 16 修正情報入力部 18 読取不能文字検出部 19 領域内正解カテゴリ検出部 20 領域外正解カテゴリ検出部 21〜27,41〜48 ステップ 31 注目カテゴリの文字 32〜39 文字イメージ A カテゴリAの文字パターンの距離値の分布領域 B カテゴリBの文字パターンの距離値の分布領域 GA カテゴリAの認識辞書の位置(平均特徴ベクト
ル) GB カテゴリBの認識辞書の位置(平均特徴ベクト
ル) C カテゴリAの正解の文字パターンの領域 R カテゴリAの読取不能の文字パターンの領域 E カテゴリAの誤り文字パターンの領域

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 書面上の文字を光学的に読取ってコード
    情報に変換する文字読取方法において、 読み取られた文字パターンの中から一定値以上の確度で
    変換できなかった文字パターンを読取不能文字とする読
    取不能文字判定ステップと、 前記読取不能文字の中の誤り文字をオペレータが修正し
    た後に、確認修正された読取不能文字を用いて、誤り文
    字を検出する誤り文字検出ステップと、 前記読取不能文字の文字イメージと候補文字をオペレー
    タに提示し、また前記誤り文字をカテゴリごとにまとめ
    てオペレータに提示する文字パターン表示制御ステップ
    とを有することを特徴とする文字読取方法。
  2. 【請求項2】 前記文字パターン表示制御ステップにお
    いて、検出された誤り文字候補の文字イメージ群を、検
    出のために用いた読取不能文字とともにオペレータに提
    示する請求項1記載の文字読取方法。
  3. 【請求項3】 前記読取不能文字判定処理ステップにお
    いて、読取不能文字判定処理でも検出できずに誤り文字
    になる傾向の強いカテゴリについては、そのカテゴリ、
    あるいはカテゴリ対を読取不能カテゴリとして予め登録
    しておき、そのカテゴリに該当する文字パターン、ある
    いは該当する文字パターンの中の代表文字パターンを検
    出して、前記文字パターン表示制御ステップを経てオペ
    レータに提示する請求項1または2記載の文字読取方
    法。
  4. 【請求項4】 書面上の文字を光学的に読取ってコード
    情報に変換する文字読取装置において、 表示部と、 読み取られた文字パターンの中から一定値以上の確度で
    変換できなかった文字パターンを読取不能文字とする読
    取不能文字判定手段と、 オペレータが確認修正した読取不能文字の特徴と読取結
    果の文字パターンの特徴とを照合して、読取不能文字の
    特徴からの距離値が一定の範囲内にある文字パターンを
    誤り文字の候補として検出する誤り文字検出手段と、 前記読取不能文字の文字イメージと候補文字を前記表示
    部に表示し、また誤り文字の候補として検出された文字
    パターンを同一カテゴリごとにまとめて前記表示部に表
    示する文字パターン表示制御手段とを有すること特徴と
    する文字読取装置。
  5. 【請求項5】 前記文字パターン表示制御手段は、検出
    された誤り文字の候補の文字イメージ群を、検出のため
    に用いた読取不能文字とともに表示する、請求項4記載
    の文字読取装置。
  6. 【請求項6】 誤り文字になる傾向の強いカテゴリ、あ
    るいはカテゴリ対が読取不能カテゴリとして予め登録さ
    れている読取不能カテゴリ登録部をさらに有し、 前記読取不能判定手段は、前記読取不能カテゴリ登録部
    に登録されているカテゴリに該当する文字パターン、あ
    るいは該当する文字パターンの中の代表文字パターンを
    検出して文字パターン表示制御手段に出力する、請求項
    4または5記載の文字読取装置。
  7. 【請求項7】 書面上の文字を光学的に読取ってコード
    情報に変換する文字読取方法において、 読み取られた文字パターンの中から一定値以上の確度で
    変換できなかった文字パターンを読取不能文字とする読
    取不能文字検出ステップと、 該読取不能文字の近傍の一定の領域内に存在する正解パ
    ターン群を検出する領域内正解パターン検出ステップ
    と、 該領域内正解パターン群が単一カテゴリの場合には、そ
    の正解カテゴリの対抗カテゴリ群を設定すると共に、そ
    れら対抗カテゴリ群の正解パターンが全て前記領域外に
    存在することを確認し、該読取不能文字を領域内の正解
    パターンと同一カテゴリとみなして該読取不能文字を訂
    正する領域外正解パターン検出ステップとを有すること
    を特徴とする文字読取方法。
  8. 【請求項8】 書面上の文字を光学的に読取ってコード
    情報に変換する文字読取装置において、 読み取られた文字パターンの中から一定値以上の確度で
    変換できなかった文字パターンを読取不能文字とする読
    取不能文字検出手段と、 該読取不能文字の近傍の一定の領域内に存在する正解パ
    ターン群を検出する領域内正解パターン検出手段と、 該領域内正解パターン群が単一カテゴリの場合には、そ
    の正解カテゴリの対抗カテゴリ群を設定すると共に、そ
    れら対抗カテゴリ群の正解パターンが全て前記領域外に
    存在することを確認し、該読取不能文字を領域内の正解
    パターンと同一カテゴリとみなして該読取不能文字を訂
    正する領域外正解パターン検出手段とを有することを特
    徴とする文字読取装置。
JP29222393A 1993-11-22 1993-11-22 文字読取方法および装置 Expired - Fee Related JP3419418B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29222393A JP3419418B2 (ja) 1993-11-22 1993-11-22 文字読取方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29222393A JP3419418B2 (ja) 1993-11-22 1993-11-22 文字読取方法および装置

Publications (2)

Publication Number Publication Date
JPH07146912A true JPH07146912A (ja) 1995-06-06
JP3419418B2 JP3419418B2 (ja) 2003-06-23

Family

ID=17779099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29222393A Expired - Fee Related JP3419418B2 (ja) 1993-11-22 1993-11-22 文字読取方法および装置

Country Status (1)

Country Link
JP (1) JP3419418B2 (ja)

Also Published As

Publication number Publication date
JP3419418B2 (ja) 2003-06-23

Similar Documents

Publication Publication Date Title
KR100411697B1 (ko) 문자판독방법및주소판독방법
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
JP4873138B2 (ja) 情報処理装置及びプログラム
US7715633B2 (en) Medium processing apparatus, medium processing method, medium processing system and computer readable recording medium with medium processing program recorded thereon
JPS6077279A (ja) 文字イメ−ジ切出し方法
US7111255B2 (en) Time-based evaluation of data verification results
JPH0696263A (ja) パターン認識装置
JP3394694B2 (ja) フォーマット情報登録方法及びocrシステム
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
JP3469375B2 (ja) 認識結果の確信度決定方法及び文字認識装置
JPH07146912A (ja) 文字読取方法および装置
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPS63146187A (ja) 文字認識装置
JP2581353B2 (ja) グラフ画像登録システム
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP2734387B2 (ja) 文字認識装置
JP2000207491A (ja) 文字列読取方法及び装置
KR20230028031A (ko) 의미 분할 학습 데이터 라벨 오류 검출 및 수정 시스템 및 그 방법
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置
JPH0612520A (ja) 文字認識装置の確認修正方式
CN116029939A (zh) 一种基于图像检测与区域提取的图像复原方法
CN114140800A (zh) 页面的智能定位方法及装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees