JP2002207960A - 認識文字修正方法及び認識文字修正プログラム - Google Patents

認識文字修正方法及び認識文字修正プログラム

Info

Publication number
JP2002207960A
JP2002207960A JP2001004814A JP2001004814A JP2002207960A JP 2002207960 A JP2002207960 A JP 2002207960A JP 2001004814 A JP2001004814 A JP 2001004814A JP 2001004814 A JP2001004814 A JP 2001004814A JP 2002207960 A JP2002207960 A JP 2002207960A
Authority
JP
Japan
Prior art keywords
character
correction
result
recognition result
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001004814A
Other languages
English (en)
Inventor
Jutaro Ishioka
寿太郎 石岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP2001004814A priority Critical patent/JP2002207960A/ja
Publication of JP2002207960A publication Critical patent/JP2002207960A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 オペレータの修正作業の負担の軽減、修正時
間の短縮と、安定した信頼性の高い修正結果を得る認識
文字修正方法と認識文字修正プログラムの提供。 【解決手段】 認識文字修正部22はモニタ4に表示さ
れた認識結果についてオペレータが棄却文字或いは誤認
識文字の修正のためキー入力を行った場合には、入力結
果と前回の修正履歴に基づいてそれら棄却イメージ或い
は誤認識された文字の自動修正を行い、次に、ハードデ
ィスク3に書き込まれた認識結果をサーチして文字イメ
ージの特徴が類似している場合に今回の修正結果で自動
修正して修正履歴を修正履歴記憶部32に記憶し、更
に、この自動修正により、カテゴリが別であっても文字
イメージの特徴が類似しているため誤って修正された文
字イメージを修正履歴記憶部32から探し出して再修正
して正解文字に修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置に関
し、特に、認識結果を修正すると同時に修正した文字に
類似する他の文字の認識結果を自動修正する認識文字の
修正技術に関する。
【0002】
【従来の技術】(1)従来、文字認識装置では入力され
た画像(イメージデータ)から文字パターンを読み取
り、読み取った文字パターンの特徴量と認識辞書に含ま
れる複数のカテゴリーの特徴量のそれぞれとを比較し、
認識候補文字を出力する文字認識処理を行って認識結果
を表示し、それを基にオペレータが棄却された入力文字
パターンや誤認識となった文字パターンを一つずつ手作
業(キー操作)で修正していた。 (2)また、特開平4−67282号公報には、オペレ
ータが認識結果を修正した修正済みの文字パターンと抽
出された他の文字パターンの全てと特徴量を比較し、そ
の文字パターンの特徴量の類似度が所定値より大きい場
合にその文字パターンに対応する文字コードをオペレー
タによって修正された文字コードに置き換えて更新する
ことにより以後の誤認識文字を正解の文字コードに自動
的に修正する方法が開示されている。
【0003】
【発明が解決しようとする課題】しかしながら、上記
(1)の方法では修正する時に全てに対してオペレータ
がキー入力する必要があるので手間がかかり、オペレー
タの負担になっていた。特に、同じように記入された癖
字が多数ある場合に同じ修正作業を繰り返し行うことと
なり、作業を効率よく行う上で問題があった。
【0004】なお、癖字についてはユーザ認識辞書に登
録する方法もあるが、個性の強い癖字まで登録するとバ
ランスを欠いて他の文字の認識まで影響を及ぼすことが
あるという問題点があった。
【0005】更に、上記(2)の方法ではオペレータが
認識結果を修正した文字パターンと、抽出された他の各
文字パターンの全てと特徴量を比較しているので処理時
間がかかるといった問題点があった。
【0006】上記問題点を解決するために開発された技
術として、本発明の発明者によって発明され本願特許出
願人によって平成12年2月21日に出願された特願2
000−042616(平成12年11月20日に国内
優先出願の特願2000−352692の基礎とされた
出願)に記載の認識文字修正方法がある。
【0007】上記特願2000−042616に記載の
認識文字修正方法によれば、文字認識処理により表示さ
れた認識結果に棄却文字又は誤認識文字がある場合に、
修正対象の棄却文字や誤認識文字について前回までにオ
ペレータがキー入力して修正した棄却文字や誤認識文字
との類似度を調べ、類似と判定された棄却文字を修正入
力文字で置き換えて修正することにより、オペレータが
同じ棄却文字又は誤認識文字についてその都度修正入力
しなくても済み、認識文字修正処理の迅速化とオペレー
タの負担の軽減を図ることができる。また、癖字があっ
ても記入者が同一であれば2回目以降は自動修正が可能
であり、この認識文字修正方法を適用した文字認識装置
は、記入者の癖による棄却文字の修正作業を大幅に減少
させる。
【0008】しかしながら、上記認識文字修正方法で、
複数の人間によって記入された帳票を大量に読み込んで
自動修正処理を行うと、別なカテゴリでも別人物であれ
ば特徴が似たようなものがある場合があるので、ある人
物の記入した帳票に対しては有効な自動修正を行うこと
ができるが、別の人物が記入した帳票に関しては間違っ
た自動修正を行う可能性があった。
【0009】また、上記問題点を解決するための技術と
して、本願特許出願人によって平成12年8月28日に
出願された特願2000−257416に記載の認識文
字修正方法がある。この認識文字修正方法によれば複数
の原稿の読み込みがある場合に原稿記入者の異なった原
稿を検出し、先の原稿の修正情報を無効として消去する
ので、今回の原稿の記入者の記入した文字が棄却された
場合にその文字(棄却文字イメージ)を前回の修正情報
で自動修正して誤った文字認識を行うようなことが生じ
ない。つまり、今回の原稿の修正情報による自動修正が
行われることになる。
【0010】しかしながら、上記特願2000−257
416に記載の技術では、別カテゴリで似たような特徴
を持った文字が自動修正対象となった場合に、間違った
文字コードに修正してしまう可能性があり、このような
場合にオペレータによって修正入力された文字が登録さ
れると、別カテゴリの特徴の近い文字が互いに悪影響を
及ぼす可能性があり、自動修正の結果が必ずしも安定せ
ず、信頼性が高いとはいえないといった問題点があっ
た。
【0011】本発明は上記問題点を解決するためになさ
れたものであり、認識結果の修正時にオペレータの修正
作業上の負担の軽減及び修正時間を短縮できると共に、
安定した信頼性の高い修正結果を得る認識文字修正方法
及び認識文字修正プログラムの提供を目的とする。
【0012】
【課題を解決するための手段】上記課題を解決するため
に、第1の発明の認識文字修正方法は、読み取られた原
稿イメージから切り出して得た文字イメージの特徴を抽
出し、抽出された各文字イメージの特徴と認識辞書とを
比較して各文字イメージの認識結果を出力し、メモリに
記憶する文字認識装置において、必要に応じて認識結果
の修正入力を行う工程と、修正入力の結果と修正入力の
対象とされた認識結果を置き換える工程と、上記工程で
認識結果が修正入力の対象となった文字イメージと、記
憶されている各文字イメージとの類似性を調べる工程
と、上記工程で類似性ありと判定された場合に、各文字
イメージのうち修正入力の対象とされた認識結果の文字
イメージと類似している文字イメージの認識結果を修正
入力の結果で順次置き換えて自動修正する工程と、各工
程で修正対象とした認識結果の文字イメージに係る修正
情報をメモリに一時記憶する工程と、自動修正により、
カテゴリが別であっても文字イメージの特徴が類似して
いるため誤って修正された認識結果の修正情報を記憶さ
れた修正情報の中から探し出す工程と、探し出した修正
情報で特定される自動修正結果に対して修正入力を行う
工程と、この修正入力の結果で特定された自動修正結果
を置き換える工程と、を備えたことを特徴とする。
【0013】また、第2の発明は上記第1の発明の認識
文字修正方法において、誤って修正された認識結果の修
正情報が記憶されている修正情報の中から探し出された
後、その探し出された修正情報を使用禁止とする工程を
含むことを特徴とする。
【0014】また、第3の発明は上記第1又は第2の発
明の認識文字修正方法において、探し出した修正情報で
特定された自動修正結果を修正する工程が終了した後、
修正入力の対象となった認識結果の文字イメージと記憶
されている各文字イメージのうちで上記修正情報で特定
される文字イメージとの類似性を調べる工程と、この工
程で類似性ありと判定された場合に、各文字イメージの
うち修正情報で特定される文字イメージと類似している
文字イメージの認識結果または自動修正結果を修正入力
の結果で置き換える工程と、を備えたことを特徴とす
る。
【0015】また、第4の発明は上記第1乃至第3のい
ずれかの発明の認識文字修正方法において、修正情報
は、修正入力の結果、修正入力の対象とされた認識結果
の文字イメージ、修正入力の結果で置き換える前の認識
結果、修正入力の結果で置き換えた後の結果、及び文字
イメージの特徴量を含むことを特徴とする。
【0016】また、第5の発明の認識文字修正プログラ
ムは、読み取られた原稿イメージから切り出して得た文
字イメージの特徴を抽出し、抽出された各文字イメージ
の特徴と認識辞書とを比較して各文字イメージの認識結
果を出力し、メモリに記憶する文字認識装置において実
行されるプログラムであって、認識結果を表示するステ
ップと、表示された認識結果に対する修正入力の結果で
該認識結果を置き換えるステップと、修正入力の対象と
された認識結果の文字イメージと記憶されている各文字
イメージとの類似性を判定するステップと、上記ステッ
プで類似性ありと判定された場合に、各文字イメージの
うち修正入力の対象とされた認識結果の文字イメージと
類似している文字イメージの認識結果を修正入力の結果
で順次置き換えて自動修正するステップと、上記各ステ
ップで修正対象とした認識結果の文字イメージに係る修
正情報をメモリに一時記憶するステップと、自動修正に
より、カテゴリが別であっても文字イメージの特徴が類
似しているため誤って修正された認識結果の修正情報を
記憶された修正情報の中から探し出すステップと、探し
出された修正情報を次回以降使用禁止とするステップ
と、使用禁止とされた修正情報で特定される自動修正結
果に対して行われた修正入力の結果で特定された自動修
正結果を置き換えるステップと、を含むことを特徴とす
る。
【0017】
【発明の実施の形態】1.構成 図1は本発明の認識文字の修正方法を適用可能な文字認
識装置の一実施例の構成を示すブロック図であり、図2
は認識処理部2の一実施例を示すブロック図である。図
1で、文字認識装置10は、原稿読取り装置1、認識処
理部2、ハードディスク(HD)3、モニタ4及びキー
ボード5を備えている。
【0018】原稿読取り装置1はOCR(光学的文字読
取り装置)やスキャナー等のイメージリーダからなり、
原稿を読み取ってイメージデータに変換し、認識処理部
2に渡す。また、認識処理部2は、図2に示すように文
字認識部21、認識文字修正部22、制御部23及び認
識辞書31と修正履歴記憶部32を備えている。
【0019】図2で、文字認識部21は原稿読取り装置
1から受け取ったイメージデータから1文字分ずつ文字
イメージを切り出して文字認識処理を行い、認識結果
(文字コード或いは棄却コード)を出力する。
【0020】また、認識文字修正部22は棄却イメージ
の修正或いは誤認識の修正のためにオペレータによって
キーボード5から修正入力がされた場合には、入力結果
と前回の修正履歴に基づいてそれら棄却イメージ或いは
誤認識された文字の自動修正を行い、次に、ハードディ
スク3に書き込まれた認識結果をサーチして文字イメー
ジの特徴が類似している場合に今回の修正結果で自動修
正して修正履歴を更新・追加し、更に、この自動修正に
より、カテゴリが別であっても文字イメージの特徴が類
似しているため誤って修正された結果を修正履歴から探
し出して再修正して正解文字に修正する。
【0021】また、制御部23はCPU、内部メモリ
(RAM)およびその周辺回路からなり、上述した文字
認識装置10全体の制御と、文字認識装置10及び認識
処理部2の各構成部分の動作を制御する。また、制御部
23はハードディスク3又はプログラム格納用ROMに
格納された認識処理プログラム(図2の文字認識部21
及び認識文字修正部22に相当)の実行を制御し文字認
識及び認識文字の修正を行う。
【0022】また、修正履歴記憶部32はキー入力した
文字コード、キー入力の対象となった認識結果(キー入
力された文字コードで置換される前の認識結果)、その
認識結果に対応する文字イメージ(以下、修正前棄却文
字イメージ)、キー入力された文字コードで置換された
結果、及び特徴量等を含む修正情報を記憶するメモリ領
域であり、制御部23の内部メモリ、ハードディスク又
は図示しないメモリに認識結果を記憶する領域と共に確
保されている。
【0023】また、ハードディスク3には認識辞書31
を格納する領域が確保されている(認識辞書31はRO
M又は物理的に別のハードディスクとしてもよい)。ま
た、ハードディスク3には認識処理プログラムのほか文
字認識装置10の実行制御に必要な各種プログラム群を
格納することもできる。 2.動作 図3は、図2の認識文字修正部22の動作の一実施例を
示すフローチャートであり、各ステップの動作シーケン
スの制御は制御部23によって行われる。 ステップS0:(認識処理等) 原稿読取り装置1で読み取られた原稿イメージ(図4)
は、イメージデータに変換され、文字認識部21で1文
字分ずつ文字イメージを切り出して文字認識処理され
る。そして、認識結果(文字コード及び棄却コード(例
えば「?」に対応するコード))とそれぞれの認識結果
が対応する文字イメージ(原稿読取り装置1で読み取ら
れた原稿イメージ)の特徴量が出力され、原稿1枚単位
でハードディスク3に記憶される。文字認識部21は原
稿読取り装置1にセットされた原稿が全て読み取られる
毎に、文字認識〜ハードディスク3への記憶動作を繰り
返し、原稿読取りが全て終了するとS1に遷移する。な
お、文字認識の際、棄却された文字イメージには棄却記
号(実施例では「?」)に対応する文字コードが対応付
けられる。
【0024】ステップS1:(認識結果及び特徴量の読
み出し及び表示) 認識文字修正部22は、ハードディスク3から原稿1枚
分の認識結果(文字コード)及び原稿読取り装置1で読
み取られた各文字イメージ(原稿1枚分)の特徴量を読
み出し内部メモリに保持(記憶)すると共に、その原稿
1枚分の認識結果(文字コード)をモニタ4に送る。モ
ニタ4は受け取った文字コードを文字イメージに変換し
て表示する(この際、棄却された文字の部分には棄却記
号「?」が表示されることとなる)(図6))。
【0025】ステップS2:(オペレータによる認識結
果のチェック及び修正操作) オペレータはモニタ4に表示された1頁分の認識結果を
調べ、棄却文字(認識できなかった文字、すなわち、
棄却されたイメージで棄却を意味する棄却記号「?」が
表示されている部分に相当する文字)がある場合と、
誤認識文字(正解として認識されてはいるが原稿とは異
なった文字)を見つけた場合に原稿を参照してキーボー
ド5から正しい文字をキー入力する。
【0026】ステップS3:(オペレータによる修正入
力の有無判定) 制御部23はキーボードからの信号を調べ、キー入力が
あった場合には修正入力ありとしてS5に遷移する。
【0027】ステップS4:(頁換えまたは終了操作の
有無判定) また、制御部23はキーボードからの信号が頁換えキー
或いは終了キー操作を意味する場合はS9に遷移する。
【0028】ステップS5:(修正入力の判定(棄却文
字修正?、誤認識等修正?)) 上記ステップS4でキー入力の対象とされたモニタ4上
の文字イメージが棄却記号「?」で表示された文字イメ
ージ(以下、棄却文字イメージ)の場合には棄却文字イ
メージに対する修正入力と判定してS6に遷移し、そう
でない場合には誤認識文字等に対する修正入力と判定し
てS11に遷移する。
【0029】ステップS6:(キー入力による棄却イメ
ージの修正及び修正情報追加) 認識文字修正部22はキー入力された文字コードで内部
メモリ上の原稿1枚分のデータのうち現在修正対象とし
た棄却記号「?」の文字コード部分を入力した文字コー
ドで置き換える(これにより修正後の文字イメージがモ
ニタ4に表示される)。なお、キー入力した文字コー
ド、キー入力の対象となった認識結果(キー入力された
文字コードで置換される前の認識結果)、その認識結果
に対応する文字イメージ、キー入力された文字コードで
置換された結果、及び特徴量等を含む修正情報を修正履
歴記憶部32に記憶(追加記憶)する。
【0030】ステップS7:(修正前棄却文字イメージ
と他の棄却イメージの特徴量との比較) 認識文字修正部22は上記ステップS6で修正履歴記憶
部32に保持された修正情報で示される棄却文字イメー
ジと他の棄却文字イメージ(棄却記号「?」で置き換え
られて表示されている他の棄却文字の文字イメージ)の
類似度を判定し、類似している場合はS8に遷移し、そ
うでない場合はS9に遷移する。類似度の判定方法とし
ては、例えば、上記ステップS6で保持された修正前文
字イメージの特徴量αと棄却文字イメージの特徴量βi
(i=1〜m)との比較を順次行う。そして、特徴量の
差の絶対値Δが閾値τ以下(|α−βi|≦τ)の特徴
量の棄却イメージがある場合はそれらを類似と判定して
その位置情報を保持し、上記全ての特徴量βiについて
の比較終了後、ステップS8に遷移する。また、特徴量
の差の絶対値Δが閾値τ以下(|α−βi|≦τ)の特
徴量の棄却イメージがない場合にはS9に遷移する。
【0031】ステップS8:(棄却記号コードの修正文
字コードによる置換等) 認識文字修正部22は類似している文字イメージを有す
る棄却文字イメージ(棄却記号「?」として表示されて
いる)の文字コードを上記ステップS3でオペレータが
キー入力した文字の文字コードでそれぞれ置き換える。
これにより、上記ステップS3でオペレータがキー入力
した棄却記号「?」部分以降で、文字イメージが類似し
ている棄却記号部分は上記ステップS3でオペレータが
キー入力した文字と同じ文字で自動的に置き変えられる
こととなる。
【0032】ステップS9:(1枚分の認識文字修正処
理終了判定) 制御部23は、キーボード5からの入力信号を調べ、頁
換え入力信号又は終了信号を検出した場合はS10に遷
移し、そうでない場合は1頁分の原稿の修正未了として
S2に制御を戻し、オペレータによる修正入力操作を待
つ。
【0033】ステップS10:(認識文字修正処理終了
判定) 制御部23は、キーボード5からの入力信号が、修正処
理終了操作信号の場合は認識処理部2による処理を終了
し、そうでない場合は頁換えとしてS1に制御を戻して
次の頁の認識文字修正処理を開始する。
【0034】ステップS11:(誤認識イメージの修
正) 認識文字修正部22は上記ステップS3でキー入力され
た文字コードで内部メモリ上の原稿1枚分のデータのう
ち現在修正対象とした文字コード部分をキー入力した文
字コードで置き換える。これにより修正後の文字イメー
ジがモニタ4に表示される。なお、キー入力した文字コ
ード、キー入力の対象となった認識結果(キー入力され
た文字コードで置換される前の認識結果)、その認識結
果に対応する文字イメージ、キー入力された文字コード
で置換された結果、及び特徴量等を含む修正情報を修正
履歴記憶部32に記憶(追加記憶)する。
【0035】ステップS12:(修正対象文字が自動修
正された文字と同一の文字か否かの判定) 文字認識修正部22は、修正履歴記憶部32をサーチ
し、上記ステップS3でキー入力された文字コードで置
き換えられた文字の修正前誤認識文字イメージ(キー入
力された文字コードで置き換えられる前の認識結果の文
字イメージ)、認識結果、修正後の認識結果(=置換さ
れた文字コード)及び特徴量からなる修正情報と同じ修
正情報が以前にステップS8又はステップS14で修正
された文字の修正情報として修正履歴記憶部32に保持
されている場合、つまり、以前にステップS8又はステ
ップS14で修正されていた文字の場合にはS15に遷
移し、そうでない場合はS13に遷移する。
【0036】ステップS13:(誤認識文字と同一の文
字コードの文字イメージの特徴量の比較) 上記ステップS11で修正履歴記憶部32に記憶された
認識結果と修正前の文字コード(誤認識である認識結
果)と同じ文字コードをもつ他の認識結果(つまり、修
正前の文字と同じ文字として認識された認識結果)との
類似度と、更に、他の棄却文字イメージ(棄却記号
「?」で置き換えられて表示されている他の棄却文字の
文字イメージ)との類似度を調べ、類似している場合に
はS14に遷移し、そうでない場合はS9に遷移する。
【0037】類似度の判定方法として、例えば、上記ス
テップS11で取り出した文字イメージの特徴量αと内
部メモリに保持している文字イメージの特徴量のうち上
記文字イメージと同じ文字コードの文字イメージの特徴
量γj(j=1〜n)及び棄却記号「?」の文字イメー
ジの特徴量βi(i=1〜m)との比較を順次行う。ま
た、特徴量の差の絶対値Δが閾値τ以下(|α−γj|
≦τ又は|α−βi|≦τ)の特徴量の文字イメージが
ある場合はそれらを類似と判定してその位置情報を保持
し、上記全ての特徴量γj、βiについての比較終了
後、ステップS14に遷移する。また、特徴量の差の絶
対値Δが閾値τ以下(|α−γj|≦τ又は|α−βi
|≦τ)の特徴量の文字イメージがない場合にはS9に
遷移する。
【0038】ステップS14:(誤認識文字と同一の文
字コードの修正文字コードによる置換(自動修正)) 認識文字修正部22は、類似している文字イメージを有
する他の文字の文字コードを上記ステップS3でオペレ
ータがキー入力した文字の文字コードでそれぞれ置き換
えて修正し、S9に遷移する。また、自動修正の際、ど
の文字を修正したか分かるように、例えば、キー入力に
よる修正対象となった文字イメージと、今回自動修正さ
れる文字イメージのフィールドの番号、及び文字の番号
を修正情報に付加して修正履歴記憶部32に記憶するよ
うにする。
【0039】ステップS15:(自動修正されたときに
使われた修正情報の検出) 文字認識修正部22は、上記ステップS12で、ステッ
プS3で修正入力された文字が以前にステップS8又は
ステップS14で修正されていたと判定された文字の場
合に、修正履歴記憶部32をサーチして以前にステップ
S8又はステップS14で修正されたと判定された文字
の修正情報を検出する。修正情報の検出は、修正履歴に
記憶されている今回自動修正の対象となった文字イメー
ジのフィールドの番号、及び文字の番号を基に修正履歴
記憶部32をサーチすることにより行うことができる。
【0040】ステップS16:(使用禁止情報の付加) 文字認識修正部22は、上記ステップS16で検出され
た修正情報に対し、以後、自動的に誤修正(別カテゴリ
で似たような特徴を持った文字が自動修正対象となった
ことによる間違った修正)を行うことのないように、使
用禁止情報を付加して修正履歴記憶部32に記憶する。
【0041】ステップS17:(修正されている文字の
検出) 上記ステップS16で使用禁止情報が付加された修正情
報によって修正されている文字を修正情報を調べて検出
する。検出は、例えば、上記ステップS16で使用禁止
情報が付加されたばかりの修正情報のフィールド情報及
び桁番号をキーとして修正履歴記憶部32をサーチする
ことによって行うことができる。
【0042】ステップS18:(誤認識文字と修正され
ている文字のイメージの特徴量の比較) 文字認識修正部22は上記ステップS17で検出された
修正情報から得られる各文字イメージについて、修正対
象の誤認識文字と修正履歴記憶部32に記憶されている
修正情報のうち使用禁止情報が付加された修正情報によ
って修正されている文字との類似度を順次判定し、類似
している場合にはS19に遷移し、そうでない場合はS
13に遷移する。類似度の判定方法は、例えば、上記ス
テップS7又はS13と同様に判定することができる。
また、修正情報の中に、修正対象の誤認識文字について
行われたステップS13での特徴量の差の絶対値を基
に、今回の誤認識文字との特徴量の差の絶対値のほうが
小さいという条件を付加することにより、より信頼性の
高い修正を行うことができる。
【0043】ステップS19:(誤認識文字と同一の文
字コードの修正文字コードによる置換) 文字認識修正部22は、類似している文字イメージを有
する修正済みの文字コードを上記ステップS3でオペレ
ータがキー入力した文字の文字コードでそれぞれ置き換
え、ステップS9に遷移する。
【0044】上記構成により、カテゴリが別で似たよう
な特徴を持った文字が上記ステップS7またはS13で
自動修正対象となった場合に、間違った文字コードに修
正してしまっても正しく修正し直すことができる。ま
た、次回以降同じ間違った自動修正が行なわれないよう
に修正入力の対象となった文字の修正情報を使用禁止に
するので、同じ文字に対しては読取った帳票の範囲でカ
テゴリで似たような特徴を持った文字が自動修正対象と
なっても間違った文字コードに修正することを防止でき
る。
【0045】3.具体例 図4は原稿イメージの一例を示す。また、図5は図4の
原稿の正解文字(原稿上に正確な文字で記入された場合
の文字)を示す図、図6は図4に示した原稿イメージの
文字認識結果を示す図、図7は図6の認識結果の自動修
正結果を示す図、図8は図7の自動修正結果のうちカテ
ゴリが異なっているが文字イメージの特徴が類似してい
るため間違ってなされた文字の再修正結果を示す図であ
る。
【0046】図4、図5から明らかなように原稿イメー
ジは記入者の書き癖により正解文字との一致度(又は類
似度)がかけ離れている場合がある。このような原稿を
上記図3のフローチャートで読み取った場合の認識文字
の修正動作について図3に示したフローチャートの動作
に沿って以下に説明する。
【0047】図3のステップS0で読取られ認識処理さ
れた原稿イメージは、図6に示すような認識結果として
モニタ4に表示される(ステップS1)。オペレータは
モニタに表示された認識結果を見て、棄却文字(記号
「?」で置き換えられた部分)又は誤認識文字があるか
否かを調べると図6に示したように幾つかの修正箇所
(この例では棄却文字5個、誤認識文字1個)があるの
で、オペレータは、まず始めに図4の原稿イメージの第
1フィールドの万の位(5桁目)の誤認識文字(図6)
に対して正解文字「0」をキー入力して修正(置換)す
る(図5、図6を比較すれば明らかなように、第1フィ
ールドは「700000」が正解であるが「76000
0」と原稿の5桁目を「6」と誤認識しているので、5
桁目に「0」をキー入力する)(ステップS2)。
【0048】制御部23はキーボード5からの信号を調
べ修正入力ありとしてステップS5に遷移し(ステップ
S3)、さらに、修正入力が誤認識文字に対するもので
あることからステップS11に遷移する(ステップS
5)。
【0049】文字認識修正部22は、誤認識文字に対す
るキー入力結果「0」で認識結果「6」を置き換えモニ
タに表示し、修正履歴記憶部32に修正情報を記憶す
る。この結果、モニタ4には第1フィールドは正解文字
のとおり「700000」と表示される(ステップS1
1)。次に、文字認識修正部22は、現在オペレータの
修正対象となった文字「6」が以前に自動修正されてい
たか否かを修正履歴記憶部32をサーチして調べる。こ
の場合は最初に行われた修正のため以前に自動修正され
ていないのでステップS13に遷移する(ステップS1
2)。
【0050】文字認識修正部22は、原稿イメージの中
から修正対象となった文字イメージと特徴の近い他の文
字イメージがあるか否かを調べる。つまり、図7の第1
フィールドの5桁目の文字(図7の例で、網目をかけた
部分)の元の文字イメージ(図4の第1フィールドの5
桁目の文字イメージと類似した文字イメージを図4の第
1フィールドの4桁目以降〜第5フィールドの1桁目ま
でサーチする(この例では、サーチはフィールドの上位
桁から下位桁に向かって行われるものとする)(ステッ
プS13)、類似した文字イメージの認識結果又は自動
修正結果を全てオペレータが入力した文字の文字コード
(この例では「0」の文字コード)で置換する。この結
果、図7の枠付き「0」で示すように第2フィールドで
2ヵ所(但し、5桁目の自動修正は本来「6」であるべ
きところを文字イメージの類似によって誤って「0」に
修正された自動修正によって発生した誤修正である)、
第3フィールドで1ヵ所、第4フィールドで2ヵ所、第
5フィールドで1ヵ所が「0」に置換される(ステップ
S14)。
【0051】まだ原稿1枚分の修正は終わっていないの
で、ステップS2に戻る(ステップS9)。ここで、オ
ペレータが第2フィールドの5桁目が自動修正によって
誤修正であることを発見するとオペレータは第2フィー
ルドの5桁目に正しい文字「6」をキー入力する。この
時点で「0」と「6」に類似する文字イメージに対する
オペレータの判断が確定したことになり、自動修正に必
要な情報が揃うことになる(ステップS2)。制御部2
3はキーボード5からの信号を調べ修正入力ありとして
ステップS5に遷移し(ステップS3)、さらに、修正
入力が誤認識文字に対するものであることからステップ
S11に遷移する(ステップS5)。
【0052】文字認識修正部22は、誤認識文字に対す
るキー入力結果「6」で直前の修正結果「0」を置き換
えモニタに表示し、修正履歴記憶部32に修正情報を記
憶する。この結果、モニタ4には第2フィールドは図8
(b)に示すように「60000」と表示され正解文字
と同じになる(ステップS11)。次に、文字認識修正
部22は、今オペレータの修正対象となった文字イメー
ジの認識結果が以前に自動修正されていたか否かを修正
履歴記憶部32をサーチして調べる。この場合は直前に
修正されているのでステップS15に遷移する(ステッ
プS12)。
【0053】文字認識修正部22は、今回修正対象とな
った文字イメージのフィールド番号及び桁番号(第2フ
ィールドの5桁目)をキーとして修正履歴記憶部32を
サーチし、第2フィールドの5桁目が自動修正されたと
きに自動修正情報として用いた修正情報(キー入力によ
る修正対象となった第1フィールドの5桁目の文字イメ
ージの認識結果の修正情報)を取り出す(ステップS1
5)。
【0054】次に、文字認識修正部22は、上記ステッ
プS15で取り出した修正情報に使用禁止情報を付加
し、修正履歴記憶部32に上書記憶する。これにより、
今後第1フィールドの5桁目の修正情報を用いた自動修
正は禁止され、また、今後同じような文字イメージの修
正情報は登録されないこととなる(ステップS16)。
【0055】次に、文字認識修正部22は、上記ステッ
プS16で使用禁止情報が付加されたばかりの修正情報
のフィールド情報及び桁番号(この例では、第1フィー
ルドの5桁目)をキーとして修正履歴記憶部32をサー
チし、この修正情報によって修正された文字を検出す
る。この例では、第2フィールドの5桁目、第3フィー
ルドの3桁目、第5フィールドの3桁目と2桁目、第6
フィールドの3桁目の文字が検出される(ステップS1
7)。
【0056】文字認識修正部22は、上記ステップS1
7で検出された修正情報から得られる各文字イメージに
ついて、オペレータが修正入力した誤認識文字と特徴が
類似しているか否かを順次判定し、類似していない場合
はS13に遷移する(ステップS18)。また、類似し
ている場合は、類似している文字イメージを有する修正
済みの文字コードを上記ステップS3でオペレータがキ
ー入力した文字の文字コードでそれぞれ置き換え、図8
(b)の枠付き文字で示すように修正してステップS9
に遷移する。この例ではステップS17で検索された文
字に対し、第5フィールドの2桁目の文字イメージ(棄
却記号「?」で表されている)が類似条件を満たしてい
るので、この文字イメージの認識結果(=棄却記号
「?」の文字コード)が「6」に置換され、他の文字は
類似していないので置換されない(ステップS19)。
【0057】次に、文字認識修正部22は、オペレータ
が修正入力した第2フィールドの5桁目の文字イメージ
と類似する他の文字イメージがあるか否かを判定する
(ステップS13)。この例では原稿イメージ(図4)
の第4フィールドの4桁目の文字イメージの認識結果
(図6で棄却記号「?」で表されれている)がオペレー
タが修正入力した第2フィールドの5桁目の文字イメー
ジと類似するのでそれを修正入力した文字コード「6」
で置換する。
【0058】次に、原稿1枚分の修正が終わったので
(ステップS9)、全ての原稿について処理が終わった
かを調べる(この例では原稿が1枚のため処理を終了す
る)(ステップS10)。
【0059】なお、図8(a)はステップS19で再度
修正コードで修正しなかった場合、つまり、元の認識結
果に戻した例を示す。また、この例では最初の修正入力
対象が誤認識文字の場合を例としたが、棄却記号「?」
で表示された棄却文字の場合をステップS7以降の処理
で同様に自動修正結果の確認及び自動修正による誤認識
が生じた場合の再修正を行うことができる。
【0060】以上、本発明のいくつかの実施例について
説明したが本発明はこれらの実施例に限定されるもので
はなく、種々の変形実施が可能であることはいうまでも
ない。
【0061】
【発明の効果】上記説明したように、第1の発明の認識
文字修正方法によれば、カテゴリが別であって似たよう
な特徴を持った文字が自動修正対象となった場合に、間
違った文字コードに修正してしまっても正しく修正し直
すことができる。
【0062】また、第2の発明の認識文字修正方法によ
れば、カテゴリが別であって似たような特徴を持った文
字が自動修正対象となった場合に、正しく修正し直した
後、次回以降、同じ文字に似たような特徴を持った文字
に対して誤った自動修正が行われないように修正入力対
象となった文字の修正情報に対して使用禁止処理を行う
ので、同じ文字に対しては読取った原稿上でカテゴリが
別で似たような特徴を持った文字が自動修正対象となっ
ても誤った文字コードに修正されることを防止できる。
【0063】また、第3の発明の認識文字修正方法によ
れば、カテゴリが別であって似たような特徴を持った文
字が自動修正対象となった場合に、正しく修正し直した
後、修正入力の対象となった認識結果の文字イメージと
類似する文字イメージの認識結果又は修正結果を自動修
正できるので、カテゴリが別であって似たような特徴を
持った文字イメージの棄却文字または誤認識文字の修正
が正確に、且つ効率的にできる。
【0064】また、第4の発明の認識文字修正方法によ
れば、修正情報として修正入力の結果、修正入力の対象
とされた認識結果の文字イメージ、修正入力の結果で置
き換える前の認識結果、修正入力の結果で置き換えた後
の結果、及び文字イメージの特徴量を含んでいるので、
カテゴリが別であって似たような特徴を持った文字が自
動修正対象となった場合に、修正結果を参照して簡単に
正しく修正し直すことができる。
【0065】また、第5の発明の認識文字修正プログラ
ムによれば、文字認識された文字のうち、カテゴリが別
で似たような特徴を持った文字が認識文字修正時に自動
修正対象となった場合に、間違った文字コードに修正し
てしまっても正しく修正し直すことができる。また、次
回以降同じ間違った自動修正が行なわれないように修正
入力の対象となった文字の修正情報を使用禁止にするの
で、同じ文字に対しては読取った帳票の範囲でカテゴリ
で似たような特徴を持った文字が自動修正対象となって
も間違った文字コードに修正することを防止できる。
【図面の簡単な説明】
【図1】本発明の認識文字の修正方法を適用可能な文字
認識装置の一実施例の構成を示すブロック図である。
【図2】認識処理部の一実施例を示すブロック図であ
る。
【図3】認識文字修正部の動作の一実施例を示すフロー
チャートである。
【図4】読み取った原稿イメージの一例を示す図であ
る。
【図5】図4の原稿イメージの正解文字を示す図であ
る。
【図6】図4の原稿イメージの認識結果の一実施例を示
す図である。
【図7】図6の認識結果の自動修正結果を示す図であ
る。
【図8】図7の自動修正結果のうちカテゴリが異なって
いるが文字イメージの特徴が類似しているため間違って
なされた文字の再修正結果を示す図である。
【符号の説明】
1 原稿読取り装置 2 認識処理部 3 ハードディスク(記録媒体) 4 モニタ(表示部) 5 キーボード(修正入力手段) 10 文字認識装置 21 文字認識部 22 認識文字修正部(認識文字修正手段) 23 制御部 31 認識辞書 32 修正履歴記憶部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 読み取られた原稿イメージから切り出し
    て得た文字イメージの特徴を抽出し、抽出された各文字
    イメージの特徴と認識辞書とを比較して各文字イメージ
    の認識結果を出力し、メモリに記憶する文字認識装置に
    おいて、 必要に応じて認識結果の修正入力を行う工程と、 前記修正入力の結果と修正入力の対象とされた認識結果
    を置き換える工程と、 上記工程で認識結果が修正入力の対象となった文字イメ
    ージと、前記記憶されている各文字イメージとの類似性
    を調べる工程と、 上記工程で類似性ありと判定された場合に、前記各文字
    イメージのうち前記修正入力の対象とされた認識結果の
    文字イメージと類似している文字イメージの認識結果を
    前記修正入力の結果で順次置き換えて自動修正する工程
    と、 上記各工程で修正対象とした認識結果の文字イメージに
    係る修正情報をメモリに一時記憶する工程と、 前記自動修正により、カテゴリが別であっても文字イメ
    ージの特徴が類似しているため誤って修正された認識結
    果の修正情報を前記記憶された修正情報の中から探し出
    す工程と、 前記探し出した修正情報で特定される自動修正結果に対
    して修正入力を行う工程と、 この修正入力の結果で前記特定された自動修正結果を置
    き換える工程と、を備えたことを特徴とする認識文字修
    正方法。
  2. 【請求項2】 前記誤って修正された認識結果の修正情
    報が前記記憶されている修正情報の中から探し出された
    後、その探し出された修正情報を使用禁止とする工程を
    含むことを特徴とする請求項1記載の認識文字修正方
    法。
  3. 【請求項3】 前記探し出した修正情報で特定された自
    動修正結果を修正する工程が終了した後、修正入力の対
    象となった認識結果の文字イメージと前記記憶されてい
    る各文字イメージのうちで上記修正情報で特定される文
    字イメージとの類似性を調べる工程と、この工程で類似
    性ありと判定された場合に、前記各文字イメージのうち
    前記修正情報で特定される文字イメージと類似している
    文字イメージの認識結果または自動修正結果を前記修正
    入力の結果で置き換える工程と、を備えたことを特徴と
    する請求項1又は2記載の認識文字修正方法。
  4. 【請求項4】 前記修正情報は、前記修正入力の結果、
    修正入力の対象とされた認識結果の文字イメージ、修正
    入力の結果で置き換える前の認識結果、修正入力の結果
    で置き換えた後の結果、及び文字イメージの特徴量を含
    むことを特徴とする請求項1乃至3のいずれか1項に記
    載の認識文字修正方法。
  5. 【請求項5】 読み取られた原稿イメージから切り出し
    て得た文字イメージの特徴を抽出し、抽出された各文字
    イメージの特徴と認識辞書とを比較して各文字イメージ
    の認識結果を出力し、メモリに記憶する文字認識装置に
    おいて実行されるプログラムであって、 認識結果を表示するステップと、 前記表示された認識結果に対する修正入力の結果で該認
    識結果を置き換えるステップと、 修正入力の対象とされた認識結果の文字イメージと前記
    記憶されている各文字イメージとの類似性を判定するス
    テップと、 上記ステップで類似性ありと判定された場合に、前記各
    文字イメージのうち前記修正入力の対象とされた認識結
    果の文字イメージと類似している文字イメージの認識結
    果を前記修正入力の結果で順次置き換えて自動修正する
    ステップと、 上記各ステップで修正対象とした認識結果の文字イメー
    ジに係る修正情報をメモリに一時記憶するステップと、 前記自動修正により、カテゴリが別であっても文字イメ
    ージの特徴が類似しているため誤って修正された認識結
    果の修正情報を前記記憶された修正情報の中から探し出
    すステップと、 探し出された修正情報を使用禁止とするステップと、 使用禁止とされた修正情報で特定される自動修正結果に
    対して行われた修正入力の結果で前記特定された自動修
    正結果を置き換えるステップと、を含むことを特徴とす
    る認識文字修正プログラム。
JP2001004814A 2001-01-12 2001-01-12 認識文字修正方法及び認識文字修正プログラム Pending JP2002207960A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001004814A JP2002207960A (ja) 2001-01-12 2001-01-12 認識文字修正方法及び認識文字修正プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001004814A JP2002207960A (ja) 2001-01-12 2001-01-12 認識文字修正方法及び認識文字修正プログラム

Publications (1)

Publication Number Publication Date
JP2002207960A true JP2002207960A (ja) 2002-07-26

Family

ID=18872952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001004814A Pending JP2002207960A (ja) 2001-01-12 2001-01-12 認識文字修正方法及び認識文字修正プログラム

Country Status (1)

Country Link
JP (1) JP2002207960A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130756A1 (en) * 2007-04-19 2008-10-30 Microsoft Corporation User interface for inputting two-dimensional structures for recognition
JP2015090625A (ja) * 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2016177349A (ja) * 2015-03-18 2016-10-06 グローリー株式会社 帳票処理システム、帳票処理方法及びプログラム
JP2021081932A (ja) * 2019-11-18 2021-05-27 富士通クライアントコンピューティング株式会社 情報処理システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02220186A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字読取装置
JPH0721303A (ja) * 1993-02-19 1995-01-24 Matsushita Electric Ind Co Ltd 文字認識装置
JPH08329186A (ja) * 1995-06-01 1996-12-13 Oki Electric Ind Co Ltd 文書読取装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02220186A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字読取装置
JPH0721303A (ja) * 1993-02-19 1995-01-24 Matsushita Electric Ind Co Ltd 文字認識装置
JPH08329186A (ja) * 1995-06-01 1996-12-13 Oki Electric Ind Co Ltd 文書読取装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130756A1 (en) * 2007-04-19 2008-10-30 Microsoft Corporation User interface for inputting two-dimensional structures for recognition
JP2015090625A (ja) * 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2016177349A (ja) * 2015-03-18 2016-10-06 グローリー株式会社 帳票処理システム、帳票処理方法及びプログラム
JP2021081932A (ja) * 2019-11-18 2021-05-27 富士通クライアントコンピューティング株式会社 情報処理システム

Similar Documents

Publication Publication Date Title
KR20110076750A (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
JPH1139428A (ja) 文書映像の方向修正方法
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP2002074262A (ja) 認識文字修正方法
JP3221968B2 (ja) 文字認識装置
JP4633246B2 (ja) 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07182441A (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH1069494A (ja) 画像検索方法とその装置
JP2677271B2 (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0562020A (ja) 文字認識装置
JP4320124B2 (ja) パターン認識方法、装置及びプログラム
JPH11143983A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH03172982A (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2021157322A (ja) 情報処理装置および誤り検出方法
JP2002207965A (ja) 帳票又は原稿の文字相等性判定方法、記入者同一性判定方法、文字認識装置及び文字相等性判定プログラム
JP3310063B2 (ja) 文書処理装置
JPH07152877A (ja) 英文字認識装置
JPH0554193A (ja) 文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101012