JP4633246B2 - 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4633246B2
JP4633246B2 JP2000352692A JP2000352692A JP4633246B2 JP 4633246 B2 JP4633246 B2 JP 4633246B2 JP 2000352692 A JP2000352692 A JP 2000352692A JP 2000352692 A JP2000352692 A JP 2000352692A JP 4633246 B2 JP4633246 B2 JP 4633246B2
Authority
JP
Japan
Prior art keywords
character
input
correction
image
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000352692A
Other languages
English (en)
Other versions
JP2001312692A (ja
Inventor
寿太郎 石岡
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP2000352692A priority Critical patent/JP4633246B2/ja
Publication of JP2001312692A publication Critical patent/JP2001312692A/ja
Application granted granted Critical
Publication of JP4633246B2 publication Critical patent/JP4633246B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置に関し、特に、認識結果を修正すると同時に、修正した文字に類似する他の文字の認識結果の自動修正技術に関する。
【0002】
【従来の技術】
(1)従来、文字認識装置では入力された画像(イメージデータ)から文字パターンを読み取り、読み取った文字パターンの特徴量と辞書に含まれる複数のカテゴリーの特徴量のそれぞれとを比較し、認識候補文字を出力する文字認識処理を行って認識結果を表示し、それを基にオペレータが棄却された入力文字パターンや誤認識となった文字パターンを一つずつ手作業(キー操作)で修正していた。
(2)また、特開平4−67282号公報には、オペレータが認識結果を修正した修正済みの文字パターンと抽出された他の文字パターンの全てと特徴量を比較し、その文字パターンの特徴量の類似度が所定値より大きい場合にその文字パターンに対応する文字コードをオペレータによって修正された文字コードに置き換えて更新することにより以後の誤認識文字を正解の文字コードに自動的に修正する方法が開示されている。
【0003】
また、光学的文字読取装置(OCR)では帳票や原稿上の文字を読み取って電気信号に変換し文字イメージを出力するが、帳票には、通常、罫線や枠線が印刷されており文字は罫線や枠線内に収まるように印刷或いは記入されるので、読み取りの邪魔にならないように罫線や枠線は記入者に認識できるが装置には検出できないドロップアウトカラーで印刷されている場合が多い。これにより、文字認識の際に悪影響を及ぼす罫線や文字枠を消した状態にすることができ、装置は文字イメージのみを読み取ることができる。
【0004】
しかし、罫線や枠線をドロップアウトカラーで印刷した帳票には、特殊な色のため帳票の印刷コストが高くなる点や、色が淡いので記入者にとって見づらい点、多くの場合、装置によって一色に決まっているので帳票の種類による色分けができない点等の不都合がある。
【0005】
一方、上述したような不具合を解消するため罫線や枠線を非ドロップアウトカラーで印刷した帳票を光学的に読み取って文字認識を行う文字認識装置があるが、このような文字認識装置では、通常、文字認識を行う前段処理として罫線や枠線を検出し除去する枠線除去処理を行う場合が多い。
【0006】
【発明が解決しようとする課題】
認識結果の修正において、上記(1)の方法では修正する時も全てに対してオペレータがキー入力する必要があり、手間がかかってオペレータの負担になっていた。特に、同じように記入された癖字が多数ある場合に同じ修正作業を繰り返し行うことになり、作業を効率よく行う上で問題があった。
なお、癖字についてはユーザ辞書に登録する方法もあるが、個性の強い癖字まで登録するとバランスを欠いて他の文字の認識まで影響を及ぼすことがあるという問題点があった。
【0007】
また、上記(2)の方法ではオペレータが認識結果を修正した文字パターンと、抽出された他の各文字パターンの全てと特徴量を比較しているので処理時間がかかるといった問題点があった。
【0008】
更に、非ドロップアウトカラーで罫線または枠線(以下、罫線等と記す)が印刷された帳票を用いた場合、罫線等と文字が接触していると文字認識時に罫線等と文字との判別がつきにくく、罫線等を除去すると文字イメージの一部も除去されてしまうので、そのまま自動修正を行なうと装置の文字認識性能を低下させるといった問題点があった。
【0009】
本発明は上記問題点を解決するためになされたものであり、認識結果の修正時に(非ドロップアウトカラーで罫線等が印刷された帳票を用いる場合も含めて)、オペレータの修正作業上の負担の軽減及び修正時間の短縮と処理時間の短縮を可能にし得る認識文字の修正方法の提供を目的とする。
【0010】
上記課題を解決するために、請求項1に記載の発明では、読み取った原稿の読み取りイメージから文字イメージを切り出して文字認識を行い認識結果を得る文字認識処理における認識文字修正方法であって、原稿1枚分の文字イメージの文字コードと特徴量をコンピュータのメモリに保持すると共に、各文字コードを変換して各文字イメージを表示する文字表示ステップと、表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップと、表示されている文字イメージに対し修正入力が行われた場合に、修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップと、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップと、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を修正入力された文字とする強制入力ステップと、メモリに保持されている各文字コードのうち、修正入力の対象となった文字イメージの文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の修正ステップと、メモリに保持されている各文字コードのうち、修正対象となった文字の修正前の文字イメージの文字コードと同じ文字コードの文字イメージとの類似性を調べる類似性判定ステップと、メモリに保持されている各文字コードのうち、修正前の文字イメージと類似している文字イメージの文字コード修正入力された文字の文字コードで置換する第2の修正ステップと、上記第1の修正ステップで修正されて表示されている文字以降の文字のうち、第2の修正ステップで修正された文字の修正前の文字イメージの特徴量をメモリから消去する特徴量修正ステップと、を有することを特徴とする認識文字修正方法を提供する。
【0012】
また、請求項2に記載の発明では、更に、修正入力が行なわれた場合に、修正入力の対象となった文字が棄却記号で表示されている否かを調べるステップを有し、第1の修正ステップは、メモリに保持されている各文字コードのうち、修正入力の対象となった棄却記号の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の棄却文字修正ステップを含み、類似性判定ステップは、修正入力の対象となった文字が棄却記号で表示されている棄却対象文字の場合は、修正入力により入力された文字の特徴量とメモリに記憶されている棄却対象文字の特徴量とを比較して類似性を判定する棄却文字類似判定ステップを含み、第2の修正ステップは、棄却文字類似判定ステップで、メモリに記憶されている棄却対象文字のうち修正入力の対象となった文字と類似していると判定された棄却対象文字の文字コードを修正入力された文字の文字コードで置換する第2の棄却文字修正ステップを含み、特徴量修正ステップは、第1の棄却文字修正ステップで修正されて表示されている文字以降の文字のうち、第2の棄却文字修正ステップで修正された棄却対象文字の特徴量をメモリから消去するステップを含む、ことを特徴とする請求項1に記載の認識文字修正方法を提供する。
【0013】
また、請求項3に記載の発明では、更に、修正入力が行なわれた場合に、修正入力の対象となった文字が誤認識文字か否かを調べるステップを有し、第1の修正ステップは、メモリに保持されている各文字コードのうち、修正入力の対象となった誤認識文字の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の誤認識文字修正ステップを含み、類似性判定ステップは、修正入力の対象となった文字が誤認識文字の場合は、修正入力により入力された文字の特徴量とメモリに記憶されている文字コードのうち該修正入力により入力された文字と同じ文字コードをもつ文字コードの特徴量とを比較して類似性を判定する誤認識文字類似判定ステップを含み、第2の修正ステップは、誤認識文字類似判定ステップによりメモリに記憶されている文字コードのうち修正入力の対象となった文字と類似していると判定された文字の文字コードを修正入力された文字の文字コードで置換する第2の誤認識文字修正ステップを含み、特徴量修正ステップは、上記第1の誤認識文字修正ステップで修正されて表示されている文字以降の文字のうち、第2の誤認識文字修正ステップで修正された誤認識文字の特徴量をメモリから消去するステップを含む、とを特徴とする請求項1に記載の認識文字修正方法を提供する。
【0014】
また、請求項4に記載の発明では、文字認識処理におけプログラムを記録した記録媒体であって、コンピュータに、原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、各文字コードを変換して各文字イメージを表示するステップ、表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を修正入力された文字とする強制入力ステップ、メモリに保持されている各文字コードのうち、修正入力の対象となった文字イメージの文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の修正ステップ、メモリに保持されている各文字コードのうち、修正対象となった文字の修正前の文字イメージの文字コードと同じ文字コードの文字イメージとの類似性を調べる類似性判定ステップ、メモリに保持されている各文字コードのうち、表示されている各文字イメージのうち修正前の文字イメージと類似している文字イメージの文字コードを修正入力された文字の文字コードで置換する第2の修正ステップ、上記第1の修正ステップで修正されて表示されている文字以降の文字のうち、第2の修正ステップで修正された文字の修正前の文字イメージの特徴量をメモリから消去する特徴量修正ステップ、を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
【0015】
また、請求項5に記載の発明では、文字認識処理におけるプログラムを記録した記録媒体であって、コンピュータに、原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、各文字コードを変換して各文字イメージを表示するステップ、表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を修正入力された文字とする強制入力ステップ、修正入力の対象となった文字が棄却記号で表示されている否かを調べる修正文字判定ステップ、メモリに保持されている各文字コードのうち、修正入力の対象となった棄却記号の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の棄却文字修正ステップ、修正入力の対象となった文字が棄却記号で表示されている棄却対象文字の場合は、修正入力により入力された文字の特徴量とメモリに記憶されている棄却対象文字の特徴量とを比較して類似性を判定する棄却文字類似判定ステップ、棄却文字類似判定ステップで、メモリに記憶されている棄却対象文字のうち前記修正入力の対象となった文字と類似していると判定された棄却対象文字の文字コードを前記修正入力された文字の文字コードで置換する第2の棄却文字修正ステップ、第1の棄却文字修正ステップで修正されて表示されている文字以降の文字のうち、第2の棄却文字修正ステップで修正された棄却対象文字の特徴量をメモリから消去するステップ、を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
【0016】
また、請求項6に記載の発明では、文字認識処理におけるプログラムを記録した記録媒体であって、コンピュータに、原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、各文字コードを変換して各文字イメージを表示するステップ、表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、修正入力により入力された文字が所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を修正入力された文字とする強制入力ステップ、修正入力の対象となった文字が誤認識文字か否かを調べるステップ、メモリに保持されている各文字コードのうち、修正入力の対象となった誤認識文字の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の誤認識文字修正ステップ、修正入力の対象となった文字が誤認識文字の場合は、修正入力により入力された文字の特徴量とメモリに記憶されている文字コードのうち該修正入力により入力された文字と同じ文字コードをもつ文字コードの特徴量とを比較して類似性を判定する誤認識文字類似判定ステップ、誤認識文字類似判定ステップによりメモリに記憶されている文字コードのうち前記修正入力の対象となった文字と類似していると判定された文字の文字コードを修正入力された文字の文字コードで置換する第2の誤認識文字修正ステップ、上記第1の誤認識文字修正ステップで修正されて表示されている文字以降の文字のうち、第2の誤認識文字修正ステップで修正された誤認識文字の特徴量をメモリから消去するステップ、を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
【0022】
【発明の実施の形態】
[実施の形態(1)]
図1は本発明の認識文字の修正方法を適用可能な文字認識装置の一実施例の構成を示すブロック図であり、図2は認識処理部2の一実施例を示すブロック図である。
図1で、文字認識装置10は、原稿読取り装置1、認識処理部2、ハードディスク(HD)3、モニタ4及びキーボード5を備えている。
【0023】
原稿読取り装置1はOCR(光学的文字読取り装置)やスキャナー等のイメージリーダからなり、原稿を読み取ってイメージデータに変換し、認識処理部2に渡す。
また、認識処理部2は、図2に示すように文字認識部21、認識文字修正部22及び制御部23と辞書31を備えている。文字認識部21は原稿読取り装置1から受け取ったイメージデータから1文字分ずつ文字イメージを切り出して文字認識処理を行い、認識結果(文字コード或いは棄却コード)を出力すると共にモニタ4に表示する。また、認識文字修正部22は棄却イメージの修正或いは誤認識の修正のためにオペレータによってキーボード5からの修正入力がされた場合には、後述するようにそれら棄却イメージ或いは誤認識された文字の修正(キー入力による修正及び自動修正)を行い、ハードディスク3に書き込まれた認識結果を更新する。
【0024】
また、ハードディスク3には辞書31及び認識結果を格納する領域が確保されている(辞書31はROM又は物理的に別のハードディスクとしてもよい)。また、ハードディスク3には認識処理プログラムのほか文字認識装置10(10’)の実行制御に必要な各種プログラム群を格納することもできる。
【0025】
また、制御部23はCPU、内部メモリ(RAM)およびその周辺回路からなり、上述した文字認識装置10全体の制御及び文字認識装置10及び認識処理部2の各構成部分の動作を制御する。また、制御部23はハードディスク3又はプログラム格納用ROMに格納された認識処理プログラム(図2の文字認識部21及び認識文字修正部22に相当)の実行を制御し文字認識を行う(この際、認識処理プログラムを構成するプログラムモジュールである認識文字修正プログラムにより、本発明の認識文字修正動作の実行制御を行う)。
【0026】
図3は、図2の認識文字修正部22の動作の一実施例を示すフローチャート(S2〜S11が認識文字修正部22の動作に相当する)であり、各ステップの動作シーケンスの制御は制御部23によって行われる。
【0027】
ステップS0:(認識結果の表示等)
原稿読取り装置1で読み取られた原稿イメージ(図5)はイメージデータに変換され、文字認識部21で1文字分ずつ文字イメージが切り出されて文字認識処理される。そして、認識結果(文字コード及び棄却コード(例えば「?」に対応するコード))とそれぞれの認識結果が対応する文字イメージ(原稿読取り装置1で読み取られたイメージ)の特徴量が出力され、原稿1枚単位でハードディスク3に記憶される。文字認識部21は原稿読取り装置1にセットされた原稿が全て読み取られる毎に、文字認識〜ハードディスク3への記憶動作を繰り返し、原稿読取りが全て終了するとS1に遷移する。なお、文字認識の際、棄却された文字イメージには棄却記号(実施例では「?」)に対応する文字コードが対応付けられる。
【0028】
ステップS1:(認識結果及び特徴量の読み出し及び表示)
文字認識部21は、ハードディスク3から原稿1枚分の認識結果(文字コード)及び原稿読取り装置1で読み取られた各文字イメージ(原稿1枚分)の特徴量を読み出し内部メモリに保持(記憶)すると共に、その原稿1枚分の認識結果(文字コード)をモニタ4に送る。モニタ4は受け取った文字コードを文字イメージに変換して表示する(この際、棄却された文字の部分には棄却記号「?」が表示されることとなる)(図6)。
【0029】
ステップS2:(オペレータによる修正入力の有無判定)
オペレータはモニタ4に表示された1頁分の認識結果を原稿と対照させて調べ、(イ)棄却文字(認識できなかった文字、すなわち、棄却されたイメージで棄却を意味する棄却記号「?」が表示されている部分に相当する文字)がある場合と、(ロ)誤認識文字(正解として認識されてはいるが原稿とは異なった文字)を見つけた場合に原稿を参照してキーボード5から正しい文字をキー入力する。
【0030】
制御部23はキーボード5からの信号を調べ、キー入力があった場合には修正入力ありとしてS3に遷移する。また、ページ換えキー或いは終了キー操作がなされた場合にはS7に遷移する。
【0031】
ステップS3:(修正入力の種類の判定)
上記ステップS2でキー入力の対象とされたモニタ4上の文字イメージが棄却記号「?」で表示された文字の場合には棄却イメージ修正入力としてS4に遷移し、そうでない場合には誤認識文字等に対する修正入力としてS9に遷移する。
【0032】
ステップS4:(キー入力による棄却文字の直接修正)
認識文字修正部22はキー入力された文字コードで、内部メモリに記憶されている原稿1枚分のデータのうち修正対象とした棄却記号「?」の文字コード部分を置き換える(これにより修正後の文字イメージがモニタ4に表示される)。なお、キー入力した文字コードで置き換える前の文字コード(以下、修正前の文字コード)を内部メモリの他のエリアに保持する。
【0033】
ステップ:S5;(棄却文字イメージの類似判定)
認識文字修正部22は上記ステップS4で保持された修正前の文字(棄却文字イメージ)と、メモリに保持されている他の棄却文字(棄却記号「?」)で置き換えられて表示されている文字イメージの類似度を判定し、類似している場合はS6に遷移し、そうでない場合はS7に遷移する。類似度の判定方法としては、例えば、上記ステップS4で保持された修正前の文字コードの特徴量αと棄却記号「?」で置き換えられて表示されている棄却文字の文字イメージ(内部メモリに保持している各棄却イメージ(図10))の特徴量βi(i=1〜m)との比較を順次行う。そして、特徴量の差の絶対値Δが閾値τ以下(|α−βi|≦τ)の特徴量の棄却イメージがある場合はそれらを類似と判定してその位置情報を保持し、上記全ての特徴量βiについての比較終了後、ステップS6に遷移する。また、特徴量の差の絶対値Δが閾値τ以下(|α−βi|≦τ)の特徴量の棄却イメージがない場合にはS7に遷移する。
【0034】
ステップS6:(棄却記号コードの修正文字コードによる置換等)
認識文字修正部22は類似している文字イメージを有する棄却文字(棄却記号「?」として表示されている)の文字コードを上記ステップS2でオペレータがキー入力した文字の文字コードでそれぞれ置き換える。これにより、上記ステップS2でオペレータがキー入力した棄却記号「?」部分以降で、文字イメージが類似している棄却記号部分は上記ステップS2でオペレータがキー入力した文字と同じ文字で自動的に置き変えられることとなる。また、この際、認識文字修正部22は内部メモリに保持している各棄却イメージの特徴量βi(i=1〜m)のうちオペレータがキー入力した棄却記号部分の文字のイメージの特徴量と上記動作で置換した棄却イメージの特徴量を消去する。これにより、置換済みの棄却文字イメージの特徴量と以降の修正入力文字の特徴量との比較が生じないのでその分処理速度が速くなる。
【0035】
ステップS7:(1頁分の認識文字修正処理終了判定)
制御部23は、キーボード5からの入力信号を調べ、ページ換え入力信号を検出した場合は内部メモリ上の認識結果(文字コード)でハードディスク3に格納されている認識結果を更新してからS8に遷移し、そうでない場合はS2に制御を戻してオペレータによる修正入力操作を待つ。
【0036】
ステップS8:(認識文字修正処理終了判定)
制御部23は、キーボード5からの入力信号を調べ、修正処理終了操作信号を検出した場合は認識処理部2による処理を終了し、そうでない場合はS1に制御を戻して次のページの認識文字修正処理を開始する。
【0037】
ステップS11(誤認識イメージの修正)
認識文字修正部22は上記ステップS2でキー入力された文字コードで内部メモリ上の原稿1枚分のデータのうち修正対象とした文字イメージの文字コード部分をキー入力した文字コードで置き換える。これにより修正後の文字イメージがモニタ4に表示される。なお、修正前の文字コードを内部メモリの他のエリアに保持する。
【0038】
ステップS10:(誤認識文字の類似判定)
上記ステップS9で保持された修正前の文字(誤認文字イメージ)と修正前の文字(誤認文字イメージ)と同じ文字コードをもつ他の認識結果(つまり、修正前の文字と同じ文字として認識された認識結果)との類似度を調べ、類似している場合にはS11に遷移し、そうでない場合はS7に遷移する。類似度の判定方法として、例えば、上記ステップS9で保持された文字イメージの特徴量αと内部メモリに保持している文字イメージの特徴量のうち上記文字イメージと同じ文字コードの文字イメージの特徴量γj(j=1〜n)及び誤認識の文字イメージ(図10)の特徴量βi(i=1〜m)との比較を順次行う。また、特徴量の差の絶対値Δが閾値τ以下(|α−γj|≦τ又は|α−βi|≦τ)の特徴量の文字イメージがある場合はそれらを類似と判定してその位置情報を保持し、上記全ての特徴量γj、βiについての比較終了後、ステップS11に遷移する。また、特徴量の差の絶対値Δが閾値τ以下(|α−γj|≦τ又は|α−βi|≦τ)の特徴量の文字イメージがない場合にはS7に遷移する。
【0039】
ステップS11:(誤認識文字の修正文字コードによる置換等)
認識文字修正部22は類似している文字イメージを有する他の文字の文字コードを上記ステップS2でオペレータがキー入力した文字の文字コードでそれぞれ置き換え、S7に遷移する。これにより、上記ステップS2でオペレータがキー入力した誤認文字部分以降で、文字イメージが類似している箇所は上記ステップS2でオペレータがキー入力した文字と同じ文字で自動的に置き換えられることとなる。また、この際、認識文字修正部22は内部メモリに保持している各誤認識文字イメージの特徴量βi(i=1〜m)のうち上記により自動修正された誤認識文字イメージの特徴量を消去する。これにより、置換済みの誤認識文字イメージの特徴量と以降の修正入力文字の特徴量との比較が生じないのでその分処理速度が速くなる。
【0040】
(具体例(1))
例えば、文字認識装置10で図5に示すような原稿を読み取ったところ、図6に示したような認識結果がモニタ4に表示され(図3:ステップS0)、図6の第1フィールド51の右から4桁目の文字は「2」が正解であるが癖字のため「7」と誤認識されているものとする(ここで、記号「?」の部分は認識不能として棄却されたイメージ部分である)。
【0041】
認識文字修正部22は、まず、棄却記号「?」の部分のイメージ(棄却文字イメージ)の特徴量を内部メモリに保持する(図3:ステップS1)。
【0042】
オペレータはモニタ4に表示された認識結果(図6)と原稿(図5)を見比べ、第1フィールド51の最初の文字が「7」に認識されているが原稿では「2」であることに気付くと、キーボード5から文字「2」をキー入力する(図3:ステップS2)。
【0043】
認識文字修正部22は、修正対象の表示位置からその文字に対応する文字コードを調べると棄却記号「?」の文字コードではなく数字「7」の文字コードであることから誤認識文字の修正と判定し、誤認識文字修正動作を開始する(図3:ステップS3)。
【0044】
まず、認識文字修正部22は、モニタ4に表示されている図6の認識結果のうち現在修正対象となっているフィールド51の右から4桁目の文字「7」の文字コードをキー入力された文字「2」の文字コードで修正する。これにより、図7(a)に示すようにフィールド51の4桁目の文字は「2」に修正される(図3:ステップS9)。
【0045】
次に、現在の原稿1枚分の認識結果中のフィールド51の4桁目の文字以降の文字コードで、上記ステップS9で取り出した修正前の文字「7」の文字コードと同じ文字コード或いは棄却記号「?」と同じ文字コードがあるか否かを調べると、図6に示すようにフィールド53の4桁目、フィールド55の3桁目に文字「7」があり、フィールド51の3桁目、フィールド52の2桁目、フィールド53の3桁目、フィールド54の4桁目、及びフィールド55の2桁目に棄却記号「?」があるので、それらの文字イメージ(図11,図10)の特徴量γ、βを上記ステップS9で取り出した修正前の文字「7」の文字イメージ(図8)の特徴量αと比較する(図3:ステップS10)。
【0046】
ここで、(1) 修正前の文字「7」の文字イメージ(図8)の特徴量とフィールド53の4桁目の文字「7」の文字イメージの特徴量の差の絶対値は閾値より大きい(Δ>τ)ため、非類似と判定されてフィールド53の4桁目の文字コードは置換されない。従って、モニタ4の表示は図7(a)に示すように文字「7」のままとなる。
(2) 次に、修正前の文字「7」の文字イメージの特徴量とフィールド55の3桁目の文字「7」の文字イメージの特徴量の差の絶対値は閾値内(Δ≦τ)のため、類似と判定されてフィールド55の3桁目の文字コードは修正入力された文字「2」の文字コードで置換される。従って、モニタ4の表示は図7(a)に示すように文字「2」となる。
(3) また、修正前の文字「7」の文字イメージの特徴量とフィールド51の3桁目、フィールド52の2桁目、及びフィールド54の4桁目の棄却記号「?」のそれぞれの文字イメージの特徴量の差の絶対値はそれぞれ閾値より大きい(Δ、Δ'、Δ">τ)ので、非類似と判定されてそれらフィールドの棄却記号「?」の文字コードは置換されない。従って、モニタ4の表示はフィールド51,52,54については図7(a)に示すように棄却記号「?」のままとなる。
(4) 次に、修正前の文字「7」の文字イメージの特徴量とフィールド53の3桁目、及びフィールド55の2桁目の棄却記号「?」のそれぞれの文字イメージの特徴量の差の絶対値はそれぞれ閾値以内(Δ、Δ'≦τ)のため、類似と判定されてそれらフィールドの棄却記号「?」の文字コードはキー入力された文字「2」の文字コードで置換される。従って、モニタ4の表示はフィールド53、55については図7(a)に示すように「2」となる(図3:ステップS11)。
【0047】
つまり、図3のステップS2の1回の修正入力(キー入力)操作で、図6の認識結果「7?00」、「9?5」、「17?80」、「?600」、「547?0」が図7(a)に示すように「2?00」、「9?5」、「17280」、「?600」、「54220」に修正される(この例では、2つのフィールド53,55は完全に自動修正されたこととなる)。
【0048】
上記誤認識文字修正動作の1サイクル(S2、S3、S9〜S11)が終了しても、オペレータはフィールド51の右から4桁目をチェックしただけなので、ページ換え操作はまだ行わない。そこで、図3のステップS2に戻って、次のサイクルでオペレータはモニタ4に表示された認識結果のうち、図6の第1フィールド51の右から3桁に棄却記号「?」があることに気付くと、原稿を確かめてキーボード5から文字「3」をキー入力する(図3:ステップS2)。
【0049】
認識文字修正部22は、修正対象の表示位置からその文字に対応する文字コードを調べると棄却記号「?」の文字コードであることから棄却文字の修正と判定し、棄却文字修正動作を開始する(図3:ステップS3)。
【0050】
まず、認識文字修正部22は、モニタ4に表示されている図7(a)の認識結果のうち現在修正対象となっているフィールド51の右から3桁目の棄却文字「?」の文字コードをキー入力された文字「3」の文字コードで修正する。これにより、図7(b)に示すようにフィールド51の3桁目の文字は「3」に修正される(図3:ステップS4)。
【0051】
次に、現在の原稿1枚分の認識結果中のフィールド51の3桁目の文字以降に棄却記号「?」と同じ文字コードがあるか否かを調べると、図7(a)に示すようにフィールド52の2桁目、フィールド54の4桁目に棄却記号「?」があるので、それらの文字イメージ(図10((b)、(d))の特徴量βを上記ステップS4で取り出した棄却記号「?」の文字イメージ(図9)の特徴量α’と比較する(図3:ステップS5)。
【0052】
ここで、修正前の棄却記号「?」の文字イメージの特徴量とフィールド52の2桁目及びフィールド54の4桁目の棄却記号「?」のそれぞれの文字イメージの特徴量の差の絶対値はそれぞれ閾値以内(Δ、Δ’≦τ)のため、類似と判定されてそれらフィールドの棄却記号「?」の文字コードはキー入力された文字「3」の文字コードで置換される。従って、モニタ4の表示はフィールド52、54については図7(b)に示すように「3」となる(図3:ステップS6)。
【0053】
つまり、図6の認識結果の修正を従来の方法で行う場合には、誤認識の修正入力3個所+棄却文字の修正入力5個所の計8回のキー入力を必要とするが、本発明の方法によれば、図3のステップS2の2回の修正入力(キー入力)操作で、図6の全認識結果「7?00」、「9?5」、「17?80」、「?600」、「547?0」が図7(b)に示すように「2300」、「935」、「17280」、「3600」、「54220」に修正される(この例では、4つのフィールド52〜55が完全に自動修正されたこととなる)。
【0054】
なお、上記図3のフローチャートではステップS0で認識対象となった文字イメージの特徴量をステップS1で内部メモリに保持し、ステップS5(S10)で類似判定のための特徴量の比較を行うように構成したが、ステップS0で認識対象となった文字イメージをステップS1で内部メモリに保持し、ステップS5(S10)で内部メモリから取り出してからそれぞれの文字イメージから特徴量を抽出して類似判定のための特徴量の比較を行うように構成してもよい。
【0055】
また、上記ステップS4及びS9を省略し、ステップS6及びS7で修正入力の対象とした文字の文字コードも修正入力された文字の文字コードで置換するようにしてもよい。
また、上記図3の説明ではステップS1で棄却された文字イメージは棄却コードで置換し、棄却記号「?」で表示したが、棄却された文字イメージを差別化して(例えば、反転して)表示するようにしてもよい。
【0056】
[実施の形態(2)]
以下、本発明の認識文字の修正方法を適用可能な文字認識装置として、図1に示した文字認識装置10とは同じ構成で認識処理部2の機能が異なる以外、他の構成部分の機能は同様な機能を備えた文字認識装置10’(図1)を用いて説明する。
また、この例では、認識処理部2’は、図2に示した認識処理部2とは認識文字修正部22’の機能以外は同じ構成及び機能を備えている。ここで、認識文字修正部22’はモニタ4に表示された認識結果について、棄却イメージの修正或いは誤認識の修正としてオペレータによるキーボード5からの修正入力があった場合に、キー入力された文字の信頼性チェックを行った上で、それら棄却イメージ或いは誤認識された文字イメージの文字コードの修正を行い、ハードディスク3に書き込まれた認識結果を更新する。
【0057】
また、図4は認識文字修正部22’の動作の一実施例を示すフローチャートであり、各ステップの動作シーケンスの制御は制御部23によって行われる。なお、図4のステップS2までとS3以降の動作は図3のステップS2までとS3以降の動作と同様である。
【0058】
図3のステップS2で、オペレータがモニタ4に表示された1頁分の認識結果を原稿と対照させて調べ、棄却文字がある場合と誤認識文字を見つけた場合に、原稿を参照してキーボード5からオペレータが正しいと思う文字をキー入力したあと、認識文字修正部22’は図4のフローチャートに示すようにキー入力された文字が修正対象となった文字の修正文字としてふさわしいか否かの判定ステップS2’に遷移する。すなわち、
ステップS2’−1:(文字認識処理)
認識文字修正部22’は、図3の上記ステップS2でオペレータが修正対象とした誤認文字(又は棄却文字)の文字イメージの特徴量について辞書31に登録されているカテゴリの代表パターンの特徴との距離を求め(つまり、文字認識処理を行い)距離が最も近い(=特徴量の差が最も少ない)文字を第1位認識候補文字、次を第2位認識候補文字として、順に第5位認識候補文字までを取り出す。
【0059】
ステップS2’−2:(キー入力した文字の信頼性判定)
次に、認識文字修正部22’はキー入力した文字が上記ステップS2’−1で取り出した第1位認識候補文字〜第5位認識候補文字の中にあるか否かを調べ、ある場合には信頼性がクリアされたものとしてS3に遷移する。また、第1位認識候補文字〜第5位認識候補文字のなかにない場合にはS2’−3に遷移する。
【0060】
ステップS2’−3:(強制置換)
認識文字修正部22’はオペレータが強制置換操作(例えば、ファンクションキーF1の操作)を行った場合には、上記S2’−2のチェックの結果いかんにかかわらずS3に遷移し、そうでない場合にはS2に戻って再入力を待つ。これにより、記入ミスや誤字の場合にも認識結果を修正することができる。
【0061】
(具体例(2))
前述した具体例(1)と同様に、文字認識装置10’で図5に示すような原稿を読み取ったところ、図6に示したような認識結果がモニタ4に表示され(図3:ステップS0)、図6の第1フィールド51の右から4桁目の文字は「2」が正解であるが癖字のため「7」と誤認識されているものとする(ここで、記号「?」の部分は認識不能として棄却されたイメージ部分である)。
【0062】
認識文字修正部22’は、まず、棄却記号「?」の部分のイメージ(棄却文字イメージ)の特徴量を内部メモリに保持する(図3:ステップS1)。
【0063】
ここで、オペレータはモニタ4に表示された認識結果(図6)と原稿(図5)を見比べ、第1フィールド51の最初の文字が「7」に認識されているが原稿では「2」であることに気付き、キーボード5から文字「3」をキー入力したとする(図3:ステップS2)。
【0064】
認識文字修正部22’は、修正前の文字イメージ(図8)について辞書31に登録されているカテゴリの代表パターンの特徴との距離を求める。その結果、第1位認識候補文字として「7」、第2位認識候補文字として「7」、第3位認識候補文字として「2」、第4位認識候補文字として「2」、第5位認識候補文字として「7」を得たとする(図4:ステップS2’−1)。
【0065】
認識文字修正部22’は、次に、上記ステップS2でキー入力した文字「3」が上記ステップS2’−1で取得した第1位認識候補文字〜第5位認識候補文字のなかに含まれているか否かを調べると、この例ではキー入力した文字「3」は第1位認識候補文字〜第5位認識候補文字の中には含まれていないので、オペレータによる修正キー入力が適切でなかったと判定して、ステップS9以降の誤認識修正動作に遷移することなくS2に戻って正しい修正入力(又は、強制入力)を待つ(図4:ステップS2’−2)。ステップS2で、オペレータが原稿をもう一度見なおして修正ミスに気付き、文字「2」をキー入力すると、ステップS3の判定によってステップS9に遷移し、前述した具体例(1)と同様にしてステップS9〜S11による誤認識文字の修正が行われる。
【0066】
つまり、図3のステップS2の1回の修正入力(キー入力)操作は修正ミスにより無効となり、2回目の操作で図6の認識結果「7?00」、「9?5」、「17?80」、「?600」、「547?0」が図7(a)に示すように「2?00」、「9?5」、「17280」、「?600」、「54220」に修正されることとなる。
【0067】
上記誤認識文字修正動作の1サイクル(S2、S2’−1、S2’−2)及び2サイクル(S2、S2’−1、S2’−2、S3、S9〜S11)が終了しても、オペレータはフィールド51の右から4桁目をチェックしただけなので、ページ換え操作はまだ行わない。そこで、具体例(1)の場合と同様に、図3のステップS2に戻って、次のサイクルでオペレータはモニタ4に表示された認識結果のうち、図6の第1フィールド51の右から3桁に棄却記号「?」があることに気付くと、原稿を確かめてキーボード5から文字「3」をキー入力する(図3:ステップS2)。
【0068】
認識文字修正部22’は、修正前の文字イメージ(図8)について辞書31に登録されているカテゴリの代表パターンの特徴との距離を求める。その結果、第1位認識候補文字として「3」、第2位認識候補文字として「9」、第3位認識候補文字として「9」、第4位認識候補文字として「3」、第5位認識候補文字として「3」を得たとする(図4:ステップS2’−1)。
【0069】
認識文字修正部22’は、次に、上記ステップS2でキー入力した文字「3」が上記ステップS2’−1で取得した第1位認識候補文字〜第5位認識候補文字のなかに含まれているか否かを調べると、この例ではキー入力した文字「3」は第1位認識候補文字〜第5位認識候補文字の中に含まれているので、S3に遷移する(ステップS2’−2)。これにより、ステップS3の判定によってステップS4に遷移し、前述した具体例(1)と同様にしてステップS4〜S6による棄却文字の修正が行われる。
【0070】
つまり、図6の認識結果の修正を従来の方法で行う場合には、誤認識の修正入力3個所+棄却文字の修正入力5個所の計8回のキー入力を必要とするが、本発明の方法によれば、図3のステップS2の3回の修正入力(キー入力)操作で、図6の全認識結果「7?00」、「9?5」、「17?80」、「?600」、「547?0」が図7(b)に示すように「2300」、「935」、「17280」、「3600」、「54220」に修正され、しかも、ステップS2での修正入力文字の信頼性を確かめることができるので修正ミスの発生を防止でき、修正精度を向上させることができる。
【0071】
[実施の形態(3)]
以下、本発明の認識文字の修正方法を適用可能な文字認識装置として、図1に示した文字認識装置10とは同じ構成で認識処理2”の機能が異なる以外他の構成部分の機能は同様な機能を備えた文字認識装置10”(図1)を用いて説明する。
【0072】
この例では、認識処理部2”は、図2に示した認識処理部2とは文字認識部21”と認識文字修正部22”の機能以外は同じ構成及び機能を備えている。ここで、文字認識部21”は原稿読取り装置1から受け取ったイメージデータから1文字分ずつ文字イメージを切り出して罫線除去処理を行なった後、文字認識処理を行い、認識結果(文字コード或いは棄却コード)を出力すると共にモニタ4に表示する。
【0073】
また、認識文字修正部22”はモニタ4に表示された認識結果について、棄却イメージの修正或いは誤認識の修正としてオペレータによるキーボード5からの修正入力があった場合に、それら棄却イメージ或いは誤認識された文字イメージの文字コードの修正を行い、ハードディスク3に書き込まれた認識結果を更新する。
【0074】
図13は、認識文字修正部22”の動作の一実施例を示すフローチャート(ステップT2〜T13が認識文字修正部22”の動作に相当する)であり、各ステップの動作シーケンスの制御は制御部23によって行われる。
【0075】
ステップT0:(認識結果の表示等)
原稿読取り装置1で読み取られた原稿イメージ(図5)はイメージデータに変換され、文字認識部21”で罫線が除去され、1文字分ずつ文字イメージが切り出されて文字認識処理される。そして、認識結果(文字コード及び棄却コード(例えば「?」に対応するコード))とそれぞれの認識結果が対応する文字イメージ(原稿読取り装置1で読み取られたイメージ)及び罫線接触情報(罫線の接触位置、接触数、罫線の太さ等)が出力され、原稿1枚単位でハードディスク3に記憶される。
【0076】
文字認識部21”は原稿読取り装置1にセットされた原稿が全て読み取られる毎に、文字認識からハードディスク3への記憶動作を繰り返し、原稿読取りが全て終了するとT1に遷移する。なお、文字認識の際、棄却された文字イメージには棄却記号(実施例では「?」)に対応する文字コードが対応付けられる。
【0077】
ステップT1:(認識結果、文字イメージ、罫線接触情報読み出し、表示) 認識文字修正部22”は、ハードディスク3から原稿1枚分の認識結果(文字コード)及び原稿読取り装置1で読み取られた各文字イメージ(原稿1枚分)の文字イメージ及び罫線接触情報を読み出して内部メモリに保持(記憶)すると共に、その原稿1枚分の認識結果(文字コード)をモニタ4に送る。モニタ4は受け取った文字コードを文字イメージに変換して表示する(この際、棄却された文字の部分には棄却記号「?」が表示されることとなる)(図6)。
【0078】
ステップT2:(オペレータによる修正入力の有無判定)
オペレータはモニタ4に表示された1頁分の認識結果を原稿と対照させて調べ、(イ)棄却文字がある場合と、(ロ)誤認識文字を見つけた場合に原稿を参照してキーボード5から正しい文字をキー入力する。この際、制御部23はキーボード5からの信号を調べ、キー入力があった場合には修正入力ありとしてT3に遷移する。また、ページ換えキー或いは終了キー操作がなされた場合にはT8に遷移する。
【0079】
ステップT3:(修正入力の種類の判定)
上記ステップT2でキー入力の対象とされたモニタ4上の文字イメージが棄却記号「?」で表示された文字の場合には棄却イメージ修正入力としてT4に遷移し、そうでない場合には誤認識文字等に対する修正入力としてT10に遷移する。
【0080】
ステップT4(キー入力による棄却文字の直接修正)
認識文字修正部22”はキー入力された文字コードで、内部メモリに記憶されている原稿1枚分のデータのうち修正対象とした文字コード部分と同じ文字コード部分(棄却文字の文字コード部分)を置き換える(これにより修正後の文字イメージがモニタ4に表示される)。なお、キー入力した文字コードで置き換える前の文字コード(以下、修正前の文字コード)を内部メモリの他のエリアに保持する。
【0081】
ステップT5:(罫線接触文字のイメージ補間処理)
上記ステップT4で修正入力された棄却文字に対応する棄却文字イメージが罫線に接触していた場合または棄却記号「?」に対応する棄却文字イメージが罫線等(罫線または枠線)に接触していた場合に罫線等と文字イメージの接触部分を補間する(図14のフローチャート参照)。
【0082】
ステップT6:(棄却文字イメージの類似判定)
認識文字修正部22”は上記ステップT4またはT5で保持された修正前の文字(棄却文字イメージ)と他の棄却文字(棄却記号「?」)で置き換えられて表示されている文字イメージの類似度を判定し、類似している場合はT7に遷移し、そうでない場合はT8に遷移する。
なお、類似度の判定方法は、上記ステップT4またはT5で保持された修正前の文字コードの特徴量αと棄却記号「?」で置き換えられて表示されている棄却文字の文字イメージ(内部メモリに保持している各棄却イメージ(図10または図21、図22))の特徴量βi(i=1〜m)との比較を順次行い、前述した図3のステップS5と同様にして文字イメージの類似度を判定することができる。
【0083】
ステップT7:(棄却記号コードの修正文字コードによる置換等)
認識文字修正部22”は類似している文字イメージを有する棄却文字(棄却記号「?」として表示されている)の文字コードを上記ステップT2でオペレータがキー入力した文字の文字コードでそれぞれ置き換える。これにより、上記ステップT2でオペレータがキー入力した棄却記号「?」部分以降で、文字イメージが類似している棄却記号部分は上記ステップT2でオペレータがキー入力した文字と同じ文字で自動的に置き変えられることとなる。
【0084】
ステップT8:(1頁分の認識文字修正処理終了判定)
制御部23は、キーボード5からの入力信号を調べ、ページ換え入力信号を検出した場合は内部メモリ上の認識結果(文字コード)でハードディスク3に格納されている認識結果を更新してからT9に遷移し、そうでない場合はT2に制御を戻してオペレータによる修正入力操作を待つ。
【0085】
ステップT9:(認識文字修正処理終了判定)
制御部23は、キーボード5からの入力信号を調べ、修正処理終了操作信号を検出した場合は認識処理部2”による処理を終了し、そうでない場合はT1に制御を戻して次のページの認識文字修正処理を開始する。
【0086】
ステップT10:(誤認識イメージの修正)
認識文字修正部22”は上記ステップT2でキー入力された文字コードで、内部メモリに記憶されている原稿1枚分のデータのうち修正対象とした文字コード部分と同じ文字コード部分を置き換える。これにより、修正後の文字イメージがモニタ4に表示される。なお、修正前の文字コードを内部メモリの他のエリアに保持する。
【0087】
ステップT11:(罫線接触文字のイメージ補間処理)
上記ステップT10で修正入力された棄却文字に対応する棄却文字イメージが罫線に接触していた場合または棄却記号「?」に対応する棄却文字イメージが罫線等(罫線または枠線)に接触していた場合に罫線等と文字イメージの接触部分を補間する(図14のフローチャート参照)。
【0088】
ステップT12:(誤認識文字または棄却文字イメージの類似判定)
上記ステップT10またはT11で保持された修正前の文字(誤認文字イメージ)と修正前の文字と同じ文字コードをもつ他の認識結果(つまり、修正前の文字と同じ文字として認識された認識結果)との類似度及び棄却記号「?」で置き換えられて表示されている他の棄却文字の文字イメージとの類似度を調べ、類似している場合にはT13に遷移し、そうでない場合はT8に遷移する。
【0089】
類似度の判定方法として、例えば、上記ステップT10またはT11で保持された文字イメージの特徴量αと内部メモリに保持している文字イメージの特徴量のうち上記文字イメージと同じ文字コードの文字イメージの特徴量γj(j=1〜n)及び棄却記号「?」の文字イメージ(図10)の特徴量βi(i=1〜m)との比較を順次行う。なお、類似度の判定方法は、上記ステップT10またはT11で保持された修正前の文字コードの特徴量αと棄却記号「?」で置き換えられて表示されている棄却文字の文字イメージの特徴量βi(i=1〜m)との比較を順次行い、前述したステップT6と同様にして文字イメージの類似度を判定することができる。
【0090】
ステップT13:(誤認識文字コード、棄却記号コードの置換等)
認識文字修正部22”は類似している文字イメージを有する他の文字の文字コードを上記ステップT2でオペレータがキー入力した文字の文字コードでそれぞれ置き換え、T8に遷移する。これにより、上記ステップT2でオペレータがキー入力した誤認文字部分以降で、文字イメージが類似している箇所は上記ステップT2でオペレータがキー入力した文字と同じ文字で自動的に置き換えられることとなる。
【0091】
図14は図13のステップT5及びT11の罫線接触文字のイメージ補間処理の詳細フローチャートである。
ステップT5−1:(修正入力文字イメージの罫線接触の有無判定)
制御部23は、図13のステップT2で修正入力の対象となった文字の文字イメージが罫線等と接触していたか否かを判定し、罫線等と接触していた場合はT5−2に遷移し、そうでない場合はT5−3に遷移する。なお、罫線等との接触の有無の判定方法は図13のステップT1で内部メモリに取り込んだ罫線接触情報(修正入力の対象となった文字イメージの接触方向、接触数、接触位置及び線の太さ等)の有無から判定することができる。
【0092】
ステップT5−2:(罫線接触部分のイメージ補間)
制御部23は、上記ステップT5−1で修正入力の対象となった文字の文字イメージが罫線等と接触していた場合、つまり、図13のステップT0で罫線除去処理が行なわれた場合に、除去されたイメージ部分をオペレータによって修正入力された文字コードに対応する文字イメージと修正入力の対象となった文字イメージの罫線接触情報とを基に推定し、補間(補正)する。
【0093】
罫線接触部分のイメージ補間(補正)の具体的方法として、本発明の発明者によって発明され、本願特許の出願人によって平成11年11月22日に出願の特許出願(特願平11−331163号)があるが、本ステップではイメージ補間の際、オペレータによって修正入力された文字コードと前記接触情報を基に、修正入力の対象となった文字イメージを予め登録された予測形状情報から予測される形状に近づけるように補正した補正イメージ群を得て、この補正イメージ群の中から認識候補イメージを選択し、この認識候補イメージに対応する認識文字を出力するか否かの評価を行う、ことにより、イメージ補間を行なう。
【0094】
ステップT5−3:(補間された文字イメージの保持)
制御部23は上記ステップT5−2で補間された文字イメージをメモリに保持(一時記憶)する。
【0095】
ステップT5−4:(修正文字イメージの罫線接触の有無判定)
制御部23は、図13のステップT4またはT10で修正の対象となった文字以外の他の文字イメージが罫線等と接触していたか否かを判定し、罫線等と接触していた場合はT5−5に遷移し、そうでない場合はT5−6に遷移する。なお、罫線等との接触の有無の判定方法は上記ステップT5−2と同様に図13のステップT1で内部メモリに取り込んだ罫線接触情報(修正入力の対象となった文字イメージの接触方向、接触数、接触位置及び線の太さ等)の有無から判定することができる。
【0096】
ステップT5−5:(罫線接触部分のイメージ補間)
制御部23は、上記ステップT5−4またはT10で修正入力の対象となった他の文字イメージが罫線等と接触していた場合、つまり、図13のステップT0で罫線除去処理が行なわれた場合に、除去されたイメージ部分をオペレータによって修正入力された文字コードに対応する文字イメージと修正入力の対象となった文字イメージの罫線接触情報とを基に推定し、補間(補正)する。
【0097】
ステップT5−6:(補間された文字イメージの保持)
制御部23は上記ステップT5−5で補間された文字イメージをメモリに保持(一時記憶)する。
【0098】
(具体例(3))
例えば、文字認識装置10”で図15に示すような原稿を読み取ったところ、図16に示すような罫線除去処理後の文字イメージから図17に示したような認識結果がモニタ4に表示されたものとする(図13:ステップT0)。ここで、図17(a)の第1フィールド71の右から5桁目と4桁目、第4フィールド74の右から3桁目が本来は「2」が正解であるが図15に示したように罫線と接触しているので、罫線除去処理の際に下の横棒が削除されてしまい「7」と誤認識されている。また、第5フィールド75の右から2桁目が罫線除去処理により文字の一部が除去され棄却記号「?」が示されている(ここで、記号「?」の部分は認識不能として棄却されたイメージ部分である)。
【0099】
認識文字修正部22”は、まず、1頁分の原稿(図15)の各文字イメージ、認識結果及び罫線接触情報を内部メモリに保持する(図13:ステップT1)。
【0100】
オペレータはモニタ4に表示された認識結果(図17)と原稿(図15)を見比べ、第1フィールド71の最初の文字が「7」に認識されているが原稿では「2」であることに気付くと、キーボード5から文字「2」をキー入力する(図13:ステップT2)。
【0101】
認識文字修正部22”は、修正対象の表示位置からその文字に対応する文字コードを調べると棄却記号「?」の文字コードではなく数字「7」の文字コードであることから誤認識文字の修正と判定し、ステップT10に遷移して誤認識文字修正動作を開始する(図13:ステップT3)。
【0102】
まず、認識文字修正部22”は、モニタ4に表示されている図17(a)の認識結果のうち現在修正対象となっているフィールド71の右から5桁目の文字「7」の文字コードをキー入力された文字「2」の文字コードで修正する。これにより、図17(b)に示すようにフィールド71の右から5桁目の文字は「2」に修正される(図13:ステップT10)。
【0103】
次に、内部メモリ上にある修正対象の文字イメージ(図18)と罫線接触情報及びオペレータによって入力された文字「2」の文字イメージから罫線除去による文字イメージの損失部分(図19の罫線との重複部分)があればそれを予測してイメージ補間を行ない、図20に示すような補間後の文字イメージを得る。また、フィールド71の右から5桁目以降の文字でフィールド71の右から5桁目の文字の修正前の文字「7」の文字コードと同じ文字コードがあるか否かを調べると図17(a)に示すように第1フィールド71の右から4桁目と2桁目、第3フィールド73の右から2桁目、第4フィールド74の右から3桁目と2桁目に文字「7」があるので、それらの文字イメージ(図21)と罫線接触情報を基にイメージ補間を行ない、図20に示すような補間後の文字イメージ(補間文字イメージ)を得る(図13:ステップT11)。
【0104】
次に、文字「7」の補間文字イメージの特徴量αと文字「2」の補間イメージの特徴量β1〜β5を得ると共に、現在の原稿1枚分の認識結果中のフィールド71の5桁目の文字以降の文字コードで、棄却記号「?」と同じ文字コードがあるか否かを調べると図17(a)に示すようにフィールド75の2桁目に棄却記号「?」があるので、その文字イメージの特徴量γ1を得て、特徴量αと特徴量β1〜β5、特徴量αと特徴量γ1をそれぞれ比較する(図13:ステップT12)。
【0105】
ここで、図13のステップT13により、(A)補間文字イメージ(図20)の特徴量αと図17(a)の第1フィールド71の4桁目の文字イメージ(図21(a))の特徴量β1の差の絶対値と閾値を比較すると閾値より小さいので第1フィールド71の4桁目の文字コードが「2」の文字コードで置換される。なお、この際、修正対象の文字が罫線に接触している場合は罫線に接触している方向以外の特徴量に重み付けをし、罫線接触部分以外の特徴量を重視して判定するようにしてもよい。
(B) 次に、補間文字イメージの特徴量αと図17(a)の第1フィールド71の2桁目の文字イメージ(図21(b))の特徴量β2の差の絶対値と閾値を比較すると閾値より大きいので第1フィールド71の2桁目の文字イメージは非類似文字と判定され置換されない。従って、モニタ4の表示は「7」のままである。なお、特徴量β2は図21(b)に示すような罫線除去による欠損部分を上記イメージ補間処理(図13:ステップT11)でイメージ補間した後に抽出したものである。同様に、第3フィールド73の右から2桁目の文字イメージ(図21(c))は置換されず「7」のままとされ、第4フィールド74の右から3桁目の文字イメージは「2」に置換されるが第4フィールド74の右から2桁目の文字イメージは置換されず「7」のままとされ、第5フィールド75の右から2桁目の棄却文字の文字イメージは「2」に置換される。つまり、図13のステップT2の修正入力操作で図17(a)の認識結果が図17(c)に示すように自動修正される。
【0106】
上記誤認識文字修正動作の1サイクルが終了し、オペレータが次の修正箇所のチェックを行なう。この例では、既に全ての誤認識結果が正しく修正されたのでここで認識結果の更新を行なう(図13:ステップT8)。
【0107】
ハードディスク3を調べ、次に表示する帳票データがあればステップT3に戻って次の帳票の文字イメージ及び認識結果を表示し、以上のサイクルを繰り返す。また、ハードディスク3に記憶されている帳票がこれ以上ない場合は処理を終了する(図13:ステップT8)。
【0108】
なお、上記具体例では修正対象の文字が図13のステップT3で誤認識文字と判定された場合を例としてこの場合の自動修正動作(T1〜T3→T10〜T13→T8、T9)について説明したが、ステップT3で棄却文字と判定された場合はステップT1〜T3→T4〜T7→T8、T9により、図13のステップT2の修正入力操作で棄却文字が自動修正される。
【0109】
以上説明したように、本実施の形態(3)によれば、帳票の罫線等の印刷(印刷帳票にあっては非ドロップアウトカラーによる罫線等の印刷)の有無に関係なく、オペレータによる1回の修正入力操作で類似する文字イメージについて認識結果が自動修正される。また、非ドロップアウトカラーにより罫線等が印刷された帳票の場合、罫線に接触した文字イメージが罫線除去処理により欠損のある文字イメージとなり、文字認識の結果、棄却或いは誤認識されても、欠損部分を補間して正しく修正することができる。
【0110】
【発明の効果】
上記説明したように、請求項1〜3に記載の発明の認識文字修正方法及び請求項4〜6に記載の記録媒体に記録された認識文字修正プログラムによれば、従来技術とは異なり、オペレータが修正対象とした文字の元の文字イメージの認識結果と同じ文字イメージについてだけ比較を行うので、処理速度が速い。また、表示されている認識結果(文字イメージ)を見て修正対象の棄却文字又は誤認識文字の修正のために入力した文字の信頼性をチェックしてから自動修正を行うので、オペレータの見誤りや入力ミスによる誤修正を防止することができ、修正精度の向上(並びに結果的に修正時間の短縮)を実現することができる。
また、修正されて表示されている文字以降の文字のうち、類似判定により文字コードが置換された文字イメージの特徴量をメモリから消去することから、置換済みの棄却文字イメージの特徴量と以降の修正入力文字の特徴量との比較が生じないので、その分処理速度が速くなる。
【図面の簡単な説明】
【図1】本発明の認識文字の修正方法を適用可能な文字認識装置の一実施例の構成を示すブロック図である。
【図2】認識処理部の一実施例を示すブロック図である。
【図3】認識文字修正部の動作の一実施例を示すフローチャートである。
【図4】認識文字修正部の動作の一実施例を示すフローチャートである。
【図5】読み取った原稿イメージの一例を示す図である。
【図6】図5の読み込みイメージの認識結果の一実施例を示す図である。
【図7】図6の認識結果に対する本発明の認識文字修正方法による修正結果を示す図である。
【図8】図7でオペレータが修正対象とした誤認識文字「7」の読み込み文字イメージを示す図である。
【図9】図7でオペレータが修正対象とした棄却文字の読み込み文字イメージを示す図である。
【図10】棄却文字とされた読み込み文字イメージ群の一例を示す図である。
【図11】認識結果が「7」となった読み込み文字イメージ群の一例を示す図である。
【図12】図4で、オペレータが修正対象とした認識結果の読み込み文字イメージを示す図である。
【図13】認識文字修正部の動作の一実施例を示すフローチャートである。
【図14】罫線接触文字のイメージ補間処理の詳細フローチャートである。
【図15】読み取った原稿イメージの一例を示す図である。
【図16】罫線除去処理後の文字イメージの一例を示す図である。
【図17】図15の読み込みイメージの認識結果及び修正結果の一実施例を示す図である。
【図18】修正対象の文字イメージの一例を示す図である。
【図19】罫線除去による文字イメージの損失部分の一例を示す図である。
【図20】イメージ補間後の文字イメージ(補間文字イメージ)の一実施例を示す図である。
【図21】誤認識文字イメージの一例を示す図である。
【図22】棄却文字イメージの一例を示す図である。
【符号の説明】
3 ハードディスク(記録媒体)
10,10’,10” 文字認識装置
22,22’,22” 認識文字修正部(認識文字修正手段)
31 辞書

Claims (6)

  1. 読み取った原稿の読み取りイメージから文字イメージを切り出して文字認識を行い認識結果を得る文字認識処理における認識文字修正方法であって、
    原稿1枚分の文字イメージの文字コードと特徴量をコンピュータのメモリに保持すると共に、各文字コードを変換して各文字イメージを表示する文字表示ステップと、
    表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップと、
    前記表示されている文字イメージに対し修正入力が行われた場合に、修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップと、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップと、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を前記修正入力された文字とする強制入力ステップと、
    メモリに保持されている各文字コードのうち、修正入力の対象となった文字イメージの文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の修正ステップと、
    メモリに保持されている各文字コードのうち、修正対象となった文字の修正前の文字イメージの文字コードと同じ文字コードの文字イメージとの類似性を調べる類似性判定ステップと、
    メモリに保持されている各文字コードのうち、前記修正前の文字イメージと類似している文字イメージの文字コードを前記修正入力された文字の文字コードで置換する第2の修正ステップと、
    上記第1の修正ステップで修正されて表示されている文字以降の文字のうち、第2の修正ステップで修正された文字の修正前の文字イメージの特徴量をメモリから消去する特徴量修正ステップと、
    を有することを特徴とする認識文字修正方法。
  2. 更に、修正入力が行なわれた場合に、修正入力の対象となった文字が棄却記号で表示されている否かを調べるステップを有し、
    前記第1の修正ステップは、メモリに保持されている各文字コードのうち、前記修正入力の対象となった棄却記号の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の棄却文字修正ステップを含み、
    前記類似性判定ステップは、前記修正入力の対象となった文字が棄却記号で表示されている棄却対象文字の場合は、前記修正入力により入力された文字の特徴量とメモリに記憶されている棄却対象文字の特徴量とを比較して類似性を判定する棄却文字類似判定ステップを含み、
    前記第2の修正ステップは、前記棄却文字類似判定ステップで、前記メモリに記憶されている棄却対象文字のうち前記修正入力の対象となった文字と類似していると判定された棄却対象文字の文字コードを前記修正入力された文字の文字コードで置換する第2の棄却文字修正ステップを含み、
    前記特徴量修正ステップは、上記第1の棄却文字修正ステップで修正されて表示されている文字以降の文字のうち、上記第2の棄却文字修正ステップで修正された棄却対象文字の特徴量をメモリから消去するステップを含む、
    ことを特徴とする請求項1に記載の認識文字修正方法。
  3. 更に、修正入力が行なわれた場合に、修正入力の対象となった文字が誤認識文字か否かを調べるステップを有し、
    前記第1の修正ステップは、メモリに保持されている各文字コードのうち、修正入力の対象となった誤認識文字の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の誤認識文字修正ステップを含み、
    前記類似性判定ステップは、前記修正入力の対象となった文字が誤認識文字の場合は、前記修正入力により入力された文字の特徴量と前記メモリに記憶されている文字コードのうち該修正入力により入力された文字と同じ文字コードをもつ文字コードの特徴量とを比較して類似性を判定する誤認識文字類似判定ステップを含み、
    前記第2の修正ステップは、前記誤認識文字類似判定ステップによりメモリに記憶されている文字コードのうち前記修正入力の対象となった文字と類似していると判定された文字の文字コードを前記修正入力された文字の文字コードで置換する第2の誤認識文字修正ステップを含み、
    前記特徴量修正ステップは、上記第1の誤認識文字修正ステップで修正されて表示されている文字以降の文字のうち、上記第2の誤認識文字修正ステップで修正された誤認識文字の特徴量をメモリから消去するステップを含む、
    ことを特徴とする請求項1に記載の認識文字修正方法。
  4. 字認識処理におけるプログラムを記録した記録媒体であって、
    コンピュータに、
    原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、
    前記各文字コードを変換して各文字イメージを表示するステップ、
    表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、
    前記表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を前記修正入力された文字とする強制入力ステップ、
    メモリに保持されている各文字コードのうち、修正入力の対象となった文字イメージの文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の修正ステップ、
    メモリに保持されている各文字コードのうち、修正対象となった文字の修正前の文字イメージの文字コードと同じ文字コードの文字イメージとの類似性を調べる類似性判定ステップ、
    メモリに保持されている各文字コードのうち、表示されている各文字イメージのうち前記修正前の文字イメージと類似している文字イメージの文字コードを前記修正入力された文字の文字コードで置換する第2の修正ステップ、
    上記第1の修正ステップで修正されて表示されている文字以降の文字のうち、第2の修正ステップで修正された文字の修正前の文字イメージの特徴量をメモリから消去する特徴量修正ステップ、
    を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体。
  5. 字認識処理におけるプログラムを記録した記録媒体であって、
    コンピュータに、
    原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、
    前記各文字コードを変換して各文字イメージを表示するステップ、
    表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、
    前記表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を前記修正入力された文字とする強制入力ステップ、
    修正入力の対象となった文字が棄却記号で表示されている否かを調べる修正文字判定ステップ、
    メモリに保持されている各文字コードのうち、前記修正入力の対象となった棄却記号の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の棄却文字修正ステップ、
    前記修正入力の対象となった文字が棄却記号で表示されている棄却対象文字の場合は、前記修正入力により入力された文字の特徴量とメモリに記憶されている棄却対象文字の特徴量とを比較して類似性を判定する棄却文字類似判定ステップ、
    前記棄却文字類似判定ステップで、メモリに記憶されている棄却対象文字のうち前記修正入力の対象となった文字と類似していると判定された棄却対象文字の文字コードを前記修正入力された文字の文字コードで置換する第2の棄却文字修正ステップ
    上記第1の棄却文字修正ステップで修正されて表示されている文字以降の文字のうち、上記第2の棄却文字修正ステップで修正された棄却対象文字の特徴量をメモリから消去するステップ、
    を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. 字認識処理におけるプログラムを記録した記録媒体であって、
    コンピュータに、
    原稿1枚分の文字イメージの文字コードと特徴量をメモリに保持するステップ、
    前記各文字コードを変換して各文字イメージを表示するステップ、
    表示された文字イメージに対してキー入力による修正入力が行なわれたか否かを調べる修正入力判定ステップ、
    前記表示されている文字イメージに対し修正入力が行われた場合に、該修正入力の対象とされた文字イメージの特徴量を基に文字認識処理を行い、該イメージが属するカテゴリのうち類似度の高い順に所定数の認識候補文字を取得する信頼性判定候補文字取得ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれかと一致するか否かを判定する信頼性判定ステップ、
    修正入力により入力された文字が前記所定数の信頼性判定候補文字のいずれとも一致しない場合は、再修正入力を待って、再修正入力された文字を前記修正入力された文字とする強制入力ステップ、
    修正入力の対象となった文字が誤認識文字か否かを調べるステップ、
    メモリに保持されている各文字コードのうち、修正入力の対象となった誤認識文字の文字コードを修正入力された文字の文字コードで置換し、置換後の文字イメージを表示する第1の誤認識文字修正ステップ、
    前記修正入力の対象となった文字が誤認識文字の場合は、前記修正入力により入力された文字の特徴量と前記メモリに記憶されている文字コードのうち該修正入力により入力された文字と同じ文字コードをもつ文字コードの特徴量とを比較して類似性を判定する誤認識文字類似判定ステップ、
    前記誤認識文字類似判定ステップによりメモリに記憶されている文字コードのうち前記修正入力の対象となった文字と類似していると判定された文字の文字コードを前記修正入力された文字の文字コードで置換する第2の誤認識文字修正ステップ、
    上記第1の誤認識文字修正ステップで修正されて表示されている文字以降の文字のうち、第2の誤認識文字修正ステップで修正された誤認識文字の特徴量をメモリから消去するステップ、
    を実行させるための認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000352692A 2000-02-21 2000-11-20 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Lifetime JP4633246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000352692A JP4633246B2 (ja) 2000-02-21 2000-11-20 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-42616 2000-02-21
JP2000042616 2000-02-21
JP2000352692A JP4633246B2 (ja) 2000-02-21 2000-11-20 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2001312692A JP2001312692A (ja) 2001-11-09
JP4633246B2 true JP4633246B2 (ja) 2011-02-16

Family

ID=26585734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000352692A Expired - Lifetime JP4633246B2 (ja) 2000-02-21 2000-11-20 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4633246B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63156296A (ja) * 1986-12-19 1988-06-29 Ricoh Co Ltd 欠損文字の復元方法
JPH0520490A (ja) * 1991-07-17 1993-01-29 Toshiba Corp 光学的文字読取修正システム
JPH05217017A (ja) * 1992-02-03 1993-08-27 Ricoh Co Ltd 光学式文字読取装置
JPH0696263A (ja) * 1992-09-09 1994-04-08 Nippon Telegr & Teleph Corp <Ntt> パターン認識装置

Also Published As

Publication number Publication date
JP2001312692A (ja) 2001-11-09

Similar Documents

Publication Publication Date Title
US20110280481A1 (en) User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
US9613299B2 (en) Method of identifying pattern training need during verification of recognized text
TW200842734A (en) Image processing program and image processing device
JP2010061471A (ja) 文字認識装置およびプログラム
JP5357711B2 (ja) 文書処理装置
JP4633246B2 (ja) 認識文字修正方法および認識文字修正プログラムを記録したコンピュータ読み取り可能な記録媒体
US7680331B2 (en) Document processing device and document processing method
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP4116688B2 (ja) 辞書学習方法および文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP3794285B2 (ja) 光学式文字読取装置
JP2002074262A (ja) 認識文字修正方法
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
CN106959940A (zh) 一种便于文档自动化录入的文档格式及转换和识别方法
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH03172982A (ja) 文字認識装置
JP2002074264A (ja) 画像処理装置、画像処理方法および記録媒体
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JP2001052111A (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JP2000207491A (ja) 文字列読取方法及び装置
JPH0554193A (ja) 文字認識装置
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4633246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term