JP2001312693A - 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体 - Google Patents

文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体

Info

Publication number
JP2001312693A
JP2001312693A JP2000131854A JP2000131854A JP2001312693A JP 2001312693 A JP2001312693 A JP 2001312693A JP 2000131854 A JP2000131854 A JP 2000131854A JP 2000131854 A JP2000131854 A JP 2000131854A JP 2001312693 A JP2001312693 A JP 2001312693A
Authority
JP
Japan
Prior art keywords
character
recognition
recognition result
information
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000131854A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000131854A priority Critical patent/JP2001312693A/ja
Publication of JP2001312693A publication Critical patent/JP2001312693A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文字認識結果のなかに、含まれているはずの
ない文字が含まれていた場合、自動的にその文字を変換
したりして、より効率的に精度の良い出力結果を得るこ
とができる文字認識方法などを提供する。 【解決手段】 画像情報として与えられた文字を認識対
象にして文字認識を行い、認識した文字の文字コードを
含む認識結果を出力する文字認識方法において、認識対
象文字の記載された画像情報を読み取り(S1)、文字
認識を行って(S2)、認識結果を文字コードとして出
力し、記憶されている文字認識結果の置換情報を読み出
し、認識結果として出力された文字コードがその置換情
報中に置換対象の文字コードとして登録されているか否
かを調べ、登録されていたならば、認識結果として出力
されたその文字コードを置換情報に示された文字コード
に置換する(S3)構成にした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パーソナルコンピ
ュータなど情報処理装置や専用の文字認識装置などに実
施される文字認識方法に係わり、特に、文字認識結果の
修正方法などに関する。
【0002】
【従来の技術】コンピュータ関連技術の進歩に伴い、文
字認識技術も著しい進歩をとげ、実用化されるに至って
いる。その結果、この文字認識技術を用いて、例えば、
大量の紙文書を効率的に電子データに変換するようなこ
とが可能になった。また、指定された文字領域の文字を
認識するというような利用方法も広く普及している。こ
のような文字認識技術における課題は、いかに効率的に
精度の高い認識結果を得ることができるかということ
で、そのためには、認識結果の修正作業をできる限り自
動化し、手作業での修正作業を少なくすることが重要で
ある。したがって、この文字認識結果の修正方法に関し
て、従来よりいくつかの方法が提供されているが、一般
的な従来技術では、例えば特開平6−259468号公報に示
された単語スペル自動補正装置のように、単語情報など
言語的知識を利用して、文字認識結果を修正する。ま
た、特開平8−202811号公報に示された文字読取装置で
は、文字認識の傾向を利用して文字認識結果を修正す
る。文字認識結果を表示し、誤認識文字を利用者に指示
させ、誤認識文字であると指示された文字の類似文字情
報を利用して、文字認識結果を修正するのである。ま
た、認識結果の修正作業を人手により行う場合、その修
正作業の作業処理量を正確に把握できれば、正確な費用
計算を行うことができるようになるので、特開平6−259
180号公報記載のデータエントリ装置では、修正時のキ
ータッチ数を計数して、修正した処理量を計数する。ま
た、指定された文字領域の文字を認識する認識処理とし
ては、特開平5−298005号公報に示された情報入力装置
のように、蛍光ペンで指定された枠内の領域の数字や単
位を認識する。
【0003】
【発明が解決しようとする課題】しかしながら、特開平
6−259468号公報に示された従来技術では、言語的知識
を利用できる一般文章や決まった単語を認識する場合に
しか修正の効果がなく、数字列や規則の決まっていない
文字列の場合には有効ではない。また、特開平8−20281
1号公報に示された従来技術では、利用者が誤認識文字
を指示したり正しい文字を選択したりする必要があるの
で、操作量が増加する。すなわち、商品コードなど英数
字で構成させる文字列の場合、英字の「O」と数字の
「0」、英字の「I」と数字の「1」が類似しているた
め、この文字の誤認識が多いので、例えば、文字認識結
果に英字の「O」「I」が出てくる必要がないような例で
は、英字の「O」と認識したならば数字の「0」に、英字
の「I」と認識したならば数字の「1」に変換すればよい
のであるが、従来技術では、このようなことも行われて
いない。また、人手による修正作業の作業量を計数する
特開平6−259180号公報記載の従来技術では、修正時に
ミスタッチした数も計数されるので、正確な修正処理量
を計数することができなかった。また、蛍光ペンで指定
された領域を認識対象の文字領域として認識する特開平
5−298005号公報に示された従来技術では、蛍光ペンで
囲まれた領域を認識するようにしているので、認識する
文字の領域を蛍光ペンで誤りなくきちんと囲む必要があ
り、非常に使いにくく、記入誤りによる認識精度への影
響が大きかった。また、認識精度をさらに高める工夫も
行われていない。本発明の目的は、このような従来技術
の問題を解決し、文字認識結果のなかに、不必要な文字
が含まれていた場合、自動的にその文字を変換したりし
て、より効率的に精度の良い出力結果を得ることができ
る文字認識方法を提供することにある。また、本発明の
他の目的は、認識結果を修正する際に、修正する前と後
の文字認識結果データを比較し、修正した処理量を計数
することにより、正確な修正量を計数できる文字認識方
法を提供することにある。。また、本発明の他の目的
は、認識する文字領域を指定して行う文字認識におい
て、認識精度を向上させることができ、文字領域指定に
用いた色を利用して認識精度をさらに向上させることも
できる文字認識方法を提供することにある。
【0004】
【課題を解決するための手段】前記の課題を解決するた
めに、請求項1記載の発明では、画像情報として与えら
れた文字を認識対象にして文字認識を行い、認識した文
字の文字コードを含む認識結果を出力する文字認識方法
において、認識結果として出力した文字コードが、置換
される文字コードとして認識結果置換情報中に登録され
ている文字コードであった場合、その文字コードを前記
認識結果置換情報に従って他の文字コードに置換する方
法にした。また、請求項2記載の発明では、画像情報と
して与えられた文字を認識対象にして文字認識を行い、
認識した文字の文字コードを含む認識結果を出力する文
字認識方法において、認識結果として出力した文字コー
ドが、削除される文字コードとして認識結果削除情報中
に登録されている文字コードであった場合、その文字コ
ードを認識結果情報中から削除する方法にした。また、
請求項3記載の発明では、画像情報として与えられた文
字を認識対象にして文字認識を行い、認識した上位候補
文字の文字コードを含む認識結果を出力する文字認識方
法において、認識結果として出力した文字コードが、削
除される文字コードとして認識結果候補削除情報中に登
録されている文字コードであった場合、その文字コード
を認識結果として出力された候補文字中から削除する方
法にした。また、請求項4記載の発明では、画像情報と
して与えられた文字を認識対象にして文字認識を行い、
認識した上位候補文字の文字コードを含む認識結果を出
力する文字認識方法において、認識結果として出力した
文字コードが、順番が置換される文字コードとして認識
結果候補置換情報中に登録されている文字コードであっ
た場合、その文字コードを前記認識結果候補置換情報に
従い、候補の順番を置換する方法にした。また、請求項
5記載の発明では、請求項1乃至請求項4記載の発明に
おいて、認識結果情報中に含まれる認識の確信度情報を
用いて、認識結果の変換を行うか否かを判定する方法に
した。また、請求項6記載の発明では、請求項1乃至請
求項5記載の文字認識方法に従って文字認識を行う文字
認識装置において、認識結果置換情報、認識結果削除情
報、認識結果候補削除情報、または認識結果候補置換情
報を入力させる変換情報入力手段と、前記変換情報入力
手段により入力された情報を記憶しておく認識結果変換
情報記憶手段とを備えた。
【0005】また、請求項7記載の発明では、画像情報
として与えられた文字を認識対象にして文字認識を行
い、文字認識結果を修正する文字認識方法において、修
正する前と後の文字認識結果データを比較し、修正した
データ量および/または修正しなかったデータ量を計数
する方法にした。また、請求項8記載の発明では、請求
項7記載の発明において、文字認識結果を修正する際に
実際に入力したデータ量も計数する方法にした。また、
請求項9記載の発明では、原稿上に記載された文字を認
識する際に認識する文字領域を原稿上に存在する色と異
なる色で指定させ、その文字領域にある文字を認識する
文字認識方法において、前記異なる色で一連の文字列を
指定させ、指定された一連の文字列からその文字列の属
する文字領域を自動抽出し、抽出された文字領域の文字
を認識する方法にした。また、請求項10記載の発明で
は、原稿上に記載された文字を認識する際に認識する文
字領域を原稿上に存在する色と異なる色で指定させ、そ
の文字領域にある文字を認識する文字認識方法におい
て、文字認識を行う文字領域を自動抽出すると共に、指
定された色に応じて認識対象文字の文字種を特定して文
字認識を行う方法にした。また、請求項11記載の発明で
は、原稿上に記載された文字を認識する際に認識する文
字領域を原稿上に存在する色と異なる色で指定させ、そ
の文字領域にある文字を認識する文字認識方法におい
て、文字認識を行う文字領域を自動抽出すると共に、指
定された色に応じて文字認識を行う際の認識処理方法を
変更する方法にした。また、請求項12記載の発明では、
原稿上に記載された文字を認識する際に認識する文字領
域を原稿上に存在する色と異なる色で指定させ、その文
字領域にある文字を認識する文字認識方法において、文
字認識を行う文字領域を自動抽出すると共に、指定され
た色に応じて文字認識する複数の項目の対応付けを行う
方法にした。また、請求項13記載の発明では、原稿上に
記載された文字を認識する際に認識する文字領域を原稿
上に存在する色と異なる色で指定させ、その文字領域に
ある文字を認識する文字認識方法において、請求項9乃
至請求項12記載の文字認識方法のうちの少なくとも2つ
の方法を組み合わせた方法で文字認識を行う方法にし
た。また、請求項14記載の発明では、請求項1乃至請求
項5、請求項7乃至請求項13のいずれか1つの請求項に
記載の文字認識方法を実施するためのプログラムを記憶
した。
【0006】
【作用】前記のような手段にしたので、請求項1記載の
発明では、認識結果として出力した文字コードが、置換
される文字コードとして認識結果置換情報中に登録され
ている文字コードであった場合、その文字コードがその
認識結果置換情報に従って他の文字コードに置換され
る。請求項2記載の発明では、認識結果として出力した
文字コードが、削除される文字コードとして認識結果削
除情報中に登録されている文字コードであった場合、そ
の文字コードが認識結果情報中から削除される。請求項
3記載の発明では、認識結果として出力した文字コード
が、削除される文字コードとして認識結果候補削除情報
中に登録されている文字コードであった場合、その文字
コードが認識結果として出力された候補文字中から削除
される。請求項4記載の発明では、認識結果として出力
した文字コードが、順番が置換される文字コードとして
認識結果候補置換情報中に登録されている文字コードで
あった場合、その認識結果候補置換情報に従い、複数の
候補文字中のその文字コードの順番が置換される。請求
項5記載の発明では、請求項1乃至請求項4記載の発明
において、認識結果情報中に含まれる認識の確信度情報
により、認識結果の変換を行うか否かが判定される。請
求項6記載の発明では、請求項1乃至請求項5記載の文
字認識方法に従って文字認識を行う文字認識装置におい
て、認識結果置換情報、認識結果削除情報、認識結果候
補削除情報、または認識結果候補置換情報が入力され、
入力された情報が記憶される。
【0007】請求項7記載の発明では、修正する前と後
の文字認識結果データを比較することにより、修正した
データ量および/または修正しなかったデータ量が計数
される。請求項8記載の発明では、請求項7記載の発明
において、文字認識結果を修正する際に実際に入力した
データ量も計数される。請求項9記載の発明では、原稿
上に記載された文字を認識する際、利用者により、原稿
上に存在する色とは異なる色で認識対象の文字列が指定
され、指定された一連の文字列からその文字列の属する
文字領域が自動抽出され、抽出された文字領域の文字が
認識される。請求項10記載の発明では、原稿上に記載さ
れた文字を認識する際、原稿上に存在する色とは異なる
色で行われる利用者の文字認識対象指定に従って文字認
識の行われる文字領域が自動抽出されると共に、指定さ
れた色に応じて認識対象文字の文字種が特定され、文字
認識が行われる。請求項11記載の発明では、原稿上に記
載された文字を認識する際、原稿上に存在する色とは異
なる色で行われる利用者の文字認識対象指定に従って文
字認識の行われる文字領域が自動抽出されると共に、指
定された色に応じて文字認識を行う際の認識処理方法が
変更される。請求項12記載の発明では、原稿上に記載さ
れた文字を認識する際、原稿上に存在する色とは異なる
色で行われる利用者の文字認識対象指定に従って文字領
域の行われる文字領域が自動抽出されると共に、指定さ
れた色に応じて文字認識する複数の項目の対応付けが行
われる。請求項13記載の発明では、請求項9乃至請求項
12記載の文字認識方法のうちの少なくとも2つの方法が
組み合わされた方法で文字認識が行われる。請求項14記
載の発明では、請求項1乃至請求項5、請求項7乃至請
求項13記載の文字認識方法のうちのいずれかに従ってプ
ログラミングしたプログラムが例えば着脱可能な記憶媒
体に記憶される。
【0008】
【発明の実施の形態】以下、図面により本発明の実施の
形態を詳細に説明する。図1は本発明の第1の実施例を
示す文字認識システムの構成ブロック図である。図示し
たように、この実施例の文字認識システムは、紙面上に
記載された文字を画像情報として読み取る画像入力部1
1、画像情報として読み取られた文字を認識対象として
文字認識を行う文字認識部12、認識された文字コードが
置換される文字コードとして記憶されている場合にその
文字コードを認識結果置換情報に従って他の文字コード
に置換する認識結果置換部13、認識結果置換情報を記憶
しておく認識結果置換情報記憶部14などを備えている。
また、前記文字認識システムを実現するハードウェア構
成を図14に示す。図示したように、この実施例のハード
ウェアは、プログラムに従って動作するCPU1、基本
的なプログラムを記憶しておくROM2、各種プログラ
ムやデータを一時的に記憶するRAM3、表示装置4、
各種プログラムやデータを記憶しておくハードディスク
装置5、キーボード6、各種プログラムやデータを入力
したり、それらを記憶しておいたりするCD−ROM装
置7、画像入力装置としてのスキャナ8などを備える。
なお、前記画像入力部11はスキャナ8により実現され、
文字認識部12および認識結果置換部13はCPU1やプロ
グラムを記憶したRAM3により実現され、認識結果置
換情報記憶部14はハードディスク装置5またはCD−R
OM装置7などにより実現される。このような構成で、
本発明の第1の実施例では、画像入力部11により入力さ
れた画像情報を認識対象にして、文字認識部12が文字認
識処理を行い、認識した文字の文字コードを含む認識結
果を出力するものであり、例えば、文字認識処理として
は、特開平3−108079号公報などに示された公知の線図
形特徴抽出方法および認識方法などを用いる。また、認
識結果置換情報記憶部14には、文字認識部12により出力
された文字認識結果の置換情報を記憶しておく。例え
ば、英字の「O」を数字の「0」、英字の「I」を数字の
「1」に置換するというような情報を記憶しておくので
ある。
【0009】図2に、この実施例の動作フローを示す。
以下、図2などに従って、この実施例の動作を説明す
る。まず、画像入力部11が認識対象文字の記載された画
像情報を読み取り(S1)、文字認識部12が前記のよう
にして文字認識を行う(S2)。そして、認識結果を文
字コードとして出力する。そうすると、認識結果置換部
13が、認識結果置換情報記憶部14に記憶されている文字
認識結果の置換情報を読み出し、認識結果として出力さ
れた文字コードがその置換情報中に置換対象の文字コー
ドとして登録されているか否かを調べる。そして、登録
されていたならば、認識結果として出力されたその文字
コードを置換情報に示された文字コードに置換する(S
3)。例えば、文字認識部12により英字の「I」が出力
された場合は数字の「1」に置換するのである。こうし
て、この実施例によれば、文字認識結果中に含まれてい
るはずのない文字が含まれていた場合、自動的にその文
字を予め登録しておいた文字に置換するので、効率的に
精度の良い出力結果を得ることができる。図3は本発明
の第2の実施例を示す文字認識システムの構成ブロック
図である。図示したように、この実施例の文字認識シス
テムは、前記画像入力部11、文字認識部12、認識された
文字コードが認識結果削除情報中に登録されている文字
コードであった場合にその文字コードを削除する認識結
果削除部15、認識結果削除情報を記憶しておく認識結果
削除情報記憶部16などを備えている。また、この文字認
識システムを実現するハードウェア構成は図14に示した
とおりである。なお、前記認識結果削除部15はCPU1
やプログラムを記憶したRAM3により実現され、認識
結果削除情報記憶部16はハードディスク装置5またはC
D−ROM装置7などにより実現される。この認識結果
削除情報記憶部16には、文字認識部12により出力された
認識結果としての文字コードの削除情報が記憶しておか
れる。例えば、記号の「.」「,」を認識結果から削除す
るというような情報を記憶しておくのである。
【0010】図4に、第2の実施例の動作フローを示
す。以下、図4などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を読み取り(S11)、文字認識部12が前記のよ
うにして文字認識を行う(S12)。そして、認識結果を
文字コードとして出力する。そうすると、認識結果削除
部15が、認識結果削除情報記憶部16に記憶されている文
字認識結果の削除情報を読み出し、認識結果としての文
字コードがその削除情報中に削除対象の文字コードとし
て登録されているか否かを調べる。そして、登録されて
いたならば、文字認識結果として出力されたその文字コ
ードを削除する(S13)。例えば、削除対象の文字コー
ドとして「.」「,」が登録されている場合に、認識結果
文字列が「123.456,789」であれば、「.」
「,」を認識結果から削除し、「123456789」
を出力するのである。こうして、この実施例によれば、
例えば紙の汚れなどの原因により文字認識結果中に含ま
れているはずのない文字が含まれていた場合、自動的に
その文字が削除されるので、効率的に精度の良い出力結
果を得ることができる。図5は本発明の第3の実施例を
示す文字認識システムの構成ブロック図である。図示し
たように、この実施例の文字認識システムは、前記画像
入力部11、文字認識部12、認識された文字コードが認識
結果候補削除情報中に登録されている文字コードであっ
た場合にその文字コードを候補から削除する認識結果候
補削除部17、認識結果候補削除情報を記憶しておく認識
結果候補削除情報記憶部18などを備えている。また、こ
の文字認識システムを実現するハードウェア構成は図14
に示したとおりである。なお、前記認識結果候補削除部
17はCPU1やプログラムを記憶したRAM3により実
現され、認識結果候補削除情報記憶部18はハードディス
ク装置5またはCD−ROM装置7などにより実現され
る。この認識結果候補削除情報記憶部18には、文字認識
部12により出力された文字認識結果候補の削除情報が記
憶しておかれる。例えば、記号の「.」「,」を認識結果
から削除するというような情報を記憶しておくのであ
る。
【0011】図6に、第3の実施例の動作フローを示
す。以下、図6などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を読み取り(S21)、文字認識部12が前記のよ
うにして文字認識を行う(S22)。そして、複数の上位
候補文字の文字コードを認識結果候補として出力する。
そうすると、認識結果候補削除部17が、認識結果候補削
除情報記憶部18に記憶されている文字認識結果の候補削
除情報を読み出し、認識結果としての文字コードがその
候補削除情報中に削除対象の文字コードとして登録され
ているか否かを調べる。そして、登録されていたなら
ば、文字認識結果として出力された複数の文字コードの
なかから登録されていた文字コードを削除する(S2
3)。例えば、英字の「O」「I」が削除対象として登録
されている場合に、認識結果の候補1位が英字の
「O」、2位が数字の「0」、3位が英字の「D」であれ
ば、候補1位の英字の「O」を削除し、候補1位に数字
の「0」、候補2位に英字の「D」を出力するのである。
こうして、この実施例によれば、文字認識結果としての
候補文字中に含まれているはずのない文字が含まれてい
た場合、自動的にその文字が削除されるので、効率的に
精度の良い出力結果を得ることができる。図7は本発明
の第4の実施例を示す文字認識システムの構成ブロック
図である。図示したように、この実施例の文字認識シス
テムは、前記画像入力部11、文字認識部12、認識された
文字コードが認識結果候補置換情報中に登録されている
文字コードであった場合にその文字コードの候補中の順
番を後ろへ移動させる認識結果候補置換部19、認識結果
候補置換情報を記憶しておく認識結果候補置換情報記憶
部20などを備えている。また、この文字認識システムを
実現するハードウェア構成は図14に示したとおりであ
る。なお、前記認識結果候補置換部19はCPU1やプロ
グラムを記憶したRAM3により実現され、認識結果候
補置換情報記憶部20はハードディスク装置5またはCD
−ROM装置7などにより実現される。この認識結果候
補置換情報記憶部20には、文字認識部12により出力され
た文字認識結果候補の置換情報が記憶しておかれる。例
えば、英字の「O」と数字の「0」が候補の中にあった場
合には、数字の「0」を英字の「O」よりも上位候補に置
換するというような情報を記憶しておくのである。
【0012】図8に、第4の実施例の動作フローを示
す。以下、図8などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を読み取り(S31)、文字認識部12が前記のよ
うにして文字認識を行う(S32)。そして、複数の上位
候補文字の文字コードを認識結果候補として出力する。
そうすると、認識結果候補置換部19が、認識結果候補置
換情報記憶部20に記憶されている文字認識結果の候補置
換情報を読み出し、認識結果としての文字コードがその
候補置換情報中に置換対象の文字コードとして登録され
ているか否かを調べる。そして、登録されていたなら
ば、置換する他方の文字コードを候補置換情報中から取
得し、取得した文字コードが認識結果候補中にあるか否
かを調べ、あったならば、候補中の順番を調べ、順番が
逆であれば置換する(順番を入れ替える)(S33)。例
えば、数字の「0」を英字の「O」の上位にするというよ
うな候補置換情報が登録されている場合に、1位候補が
英字の「O」で、2位候補が数字の「0」の場合、1位候
補に数字の「0」、2位候補に英字の「O」となるように
候補文字の順番を置換するのである。こうして、この実
施例によれば、例えば文字認識結果としての候補文字中
に含まれている可能性が少ないような文字の候補中での
順番を後ろに下げることができるので、効率的に精度の
良い出力結果を得ることができる。本発明の第5の実施
例では、これまで説明してきた各実施例の文字認識方法
を組み合わせて用いることが可能である。図9に示すよ
うに、認識結果変換部21および認識結果変換情報記憶部
22を備えた構成にして、認識結果変換情報記憶部22に
は、文字認識部12により出力された文字認識結果を変換
する各種変換情報、例えば、英字の「I」を数字の「1」
に置換し、英字の「O」は候補から削除し、記号
の「.」「,」は結果から削除するというような情報を
記憶しておくのである。そして、認識結果変換部21は、
認識結果変換情報記憶部22に記憶されている文字認識結
果の変換情報に従って、文字認識部12により出力された
文字認識結果を置換したり、削除したりする。図10は本
発明の第6の実施例を示す文字認識システムの構成ブロ
ック図である。図示したように、この実施例の文字認識
システムは、前記画像入力部11、文字認識部12、認識結
果変換部21、認識結果変換情報記憶部22、認識結果の変
換を行うか否かを判定する認識結果変換判定部23などを
備えている。また、この文字認識システムを実現するハ
ードウェア構成は図14に示したとおりである。なお、前
記認識結果変換判定部23はCPU1やプログラムを記憶
したRAM3により実現される。
【0013】図11に、第6の実施例の動作フローを示
す。以下、図11などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を読み取り(S41)、文字認識部12が前記のよ
うにして文字認識を行う(S42)。そして、認識した結
果の文字コードやその結果の確からしさを示す確信度な
どを含む認識結果を出力する。続いて、認識結果変換判
断部23が、文字認識部12の出力した認識結果の確信度情
報を利用して、認識結果を変換するかしないか判定する
(S43)。例えば、認識結果の確信度が予め設定してお
いた閾値以下の場合だけ認識結果の変換を行うように判
定するのである。なお、前記閾値を予め記憶しておいて
もよい。こうして、変換すると判定されたならば(S43
でYes)、認識結果変換部21が、認識結果変換情報記憶
部22に記憶されている文字認識結果の変換情報を読み出
し、認識結果としての文字コードがその変換情報中に変
換対象の文字コードとして登録されているか否かを調べ
る。そして、登録されていたならば、変換情報に従った
変換、つまり前記置換、削除、候補からの削除、候補中
の順番の置換などを行う(S44)。なお、上記認識結果
変換部21は前述した認識結果置換部13、認識結果削除部
15、認識結果候補削除部17、認識結果候補置換部19であ
ってもよく、その場合は認識結果変換情報記憶部22も対
応する記憶手段(認識結果置換情報記憶部14、認識結果
削除情報記憶部16、認識結果候補削除情報記憶部18、認
識結果候補置換情報記憶部20)になる。こうして、この
実施例によれば、確信度が低い場合にだけ文字認識結果
が変換されるので、例えば例外的に通常は用いない文字
を用いたような場合に意図に反して誤った文字に変換さ
れてしまうというようなことがなくなる。
【0014】本発明の第7の実施例では、前記認識結果
置換情報、認識結果削除情報、認識結果候補削除情報、
または認識結果候補置換情報を入力させる変換情報入力
手段を備え、前記変換情報入力手段により入力された情
報を認識結果変換情報記憶手段に記憶する。図12は第7
の実施例を示す文字認識システムの構成ブロック図であ
る。図示したように、この実施例の文字認識システム
は、前記画像入力部11、文字認識部12、認識結果変換部
21、前記認識結果変換情報記憶手段として動作する認識
結果変換情報記憶部22、および変換情報入力手段である
変換情報入力部24などを備えている。また、この文字認
識システムを実現するハードウェア構成は図14に示した
とおりである。なお、前記変換情報入力部24はCPU
1、RAM3、キーボード6などにより実現される。ま
た、前記認識結果変換部21は認識結果置換部13、認識結
果削除部15、認識結果候補削除部17、認識結果候補置換
部19として動作し、その場合は認識結果変換情報記憶手
段はそれぞれ認識結果置換情報記憶部14、認識結果削除
情報記憶部16、認識結果候補削除情報記憶部18、認識結
果候補置換情報記憶部20(図1、図3、図5、図7参
照)になる。図13に、第7の実施例の動作フローを示
す。以下、図7などに従って、この実施例の動作を説明
する。この実施例では、まず、選択されたメニューなど
から、変換情報入力部24が変換情報の入力か否かを判定
し(S51)、変換情報の入力でなければ(S51でNo)、
画像入力部11が認識対象文字の記載された画像情報を読
み取り(S52)、文字認識部12が前記のようにして文字
認識を行う(S53)。そして、認識結果を文字コードと
して出力する。そうすると、認識結果変換部21が、認識
結果変換情報記憶部22に記憶されている文字認識結果の
変換情報(例えば置換情報や削除情報)を読み出し、認
識結果の文字コードが変換情報中に含まれていれば、そ
れに従ってその文字コードを他の文字コードに置換した
り、その文字コードを削除したりする(S54)。それに
対して、ステップS51において変換情報の入力であると
判定されたならば(S51でYes)、変換情報入力部24が
キーボード6などにより変換情報を入力させ(S55)、
入力された変換情報を認識結果変換情報記憶部22に記憶
させる(S56)。こうして、この実施例によれば、利用
者が所望の変換情報を入力し、入力した変換情報に従っ
て文字認識結果の変換を行うことができるので、用途に
合った文字認識を行うことができ、したがって、さらに
精度の良い文字認識結果を得ることができる。
【0015】本発明の第8の実施例では、修正する前と
後の文字認識結果データを比較し、修正したデータ量を
計数する。図15に示すように、この実施例の文字認識シ
ステムは、画像入力部11、文字認識部12、認識結果を修
正する認識結果修正部31、前記認識結果修正部31により
修正された修正データ量を計数する修正処理量計数部3
2、前記文字認識処理部12により認識された認識結果を
記憶しておく認識結果記憶部33、前記認識結果修正部31
により修正された修正結果を記憶しておく修正結果記憶
部34などを備えている。なお、この文字認識システムを
実現するハードウェア構成は図14に示したとおりであ
る。また、前記認識結果修正部31および修正処理量計数
部32はCPU1およびRAM3などにより実現され、認
識結果記憶部33および修正結果記憶部34はハードディス
ク装置5の一部領域として実現される。また、認識結果
修正部31は、認識結果記憶部33に記憶されている認識結
果の確認および修正を行うものであり、認識結果に違い
がないかどうかを利用者に確認させ、違いがあった場合
には、キーボード6などを用いてその結果を修正させ
る。修正処理量計数部32は、認識結果記憶部33に記憶さ
れている認識結果と修正結果記憶部34に記憶されている
修正結果とを比較して、修正されたデータ量を計数す
る。例えば、認識結果が「コンピュータシステム聞発
室」で、修正結果が「コンピュータシステム開発室」で
あった場合、「聞」と「開」の1文字だけが異なるの
で、修正したデータ量を1文字と計数するのである。図
16に、第8の実施例の動作フローを示す。以下、図8な
どに従って、この実施例の動作を説明する。まず、画像
入力部11が認識対象文字の記載された画像情報を読み取
り(S61)、文字認識部12が前記のようにして文字認識
を行う(S62)。そして、認識結果を文字コードとして
認識結果記憶部33に記憶させる。そうすると、認識結果
修正部31が認識結果である文字コード列を取得し、例え
ば「コンピュータシステム聞発室」というように認識結
果を表示装置4に表示させ、誤りがあれば利用者に修正
させ(S63)、修正された文字コード列を修正結果記憶
部34に記憶させる。なお、この際に修正ミスなどがあり
再修正が行われると、再修正結果のみを修正された文字
コード列として記憶させる。こうして、修正が終了する
と、修正処理量計数部32が、認識結果記憶部33から認識
結果としての文字コード列を読み出し、修正結果記憶部
34から修正結果としての文字列を読み出し、2つの文字
列を先頭から順次比較することにより修正された文字数
を計数する。
【0016】このように、この実施例によれば、認識結
果を修正する際、修正する前と後の文字認識結果データ
が1文字づつ比較され、修正された文字数が修正データ
量として計数されるので、正確な修正量を計数すること
ができ、したがって、修正に対する対価としての正確な
費用計算などを行うことができる。前記において、修正
量を計数する代わりに、同様な方法で、修正されていな
いデータ量を計数する構成も可能である。例えば、認識
結果が「コンピュータシステム聞発室」で、修正結果が
「コンピュータシステム開発室」であった場合、「聞」
と「開」の1文字だけが異なるので、修正していないデ
ータ量を12文字と計数するのである。このような構成で
は、修正していないデータ量を計数することにより、正
しく認識できた処理量を正確に計数することができ、例
えば文字認識処理の利用料を支払うシステムにおいて、
有効な処理量分だけの利用料計算を正確かつ容易に実現
することができる。また、前記において、修正されたデ
ータ量および修正されていないデータ量の両方を計数す
る構成も可能である。このような構成では、修正に対す
る対価としての正確な費用計算を行うことができるし、
文字認識処理の利用料を支払うシステムにおいて、有効
な処理量分だけの利用料計算を正確かつ容易に実現する
こともできる。なお、この構成で、修正結果としての全
体量(修正結果記憶部34に記憶された文字列の全体)と
修正されたデータ量とを計数するようにしてもよい。修
正されなかったデータ量は全体量から修正されたデータ
量を減じることにより求めることができるからである。
本発明の第9の実施例では、図17に示すように、第8の
実施例の構成に加えて修正時入力量も計数する修正時入
力量計数部35を備える。なお、この修正時入力量計数部
35はCPU1およびRAM3などにより実現される。ま
た、修正時入力量計数部35は、認識結果修正部31が修正
を行った際、実際に修正作業として入力したデータ量を
計数するものであり、例えば、修正作業時にキーボード
6により修正する文字を入力する場合、キーボード6か
ら入力した文字数(キータッチ数)を計数する。
【0017】図18に、第9の実施例の動作フローを示
す。以下、図9などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を読み取り(S71)、文字認識部12が前記のよ
うにして文字認識を行う(S72)。そして、認識結果を
文字コードとして認識結果記憶部33に記憶させる。そう
すると、認識結果修正部31が認識結果である文字コード
列を取得し、例えば「コンピュータシステム聞発室」と
いうように認識結果を表示装置4に表示させ、誤りがあ
れば利用者に修正させ、修正された文字コード列を修正
結果記憶部34に記憶させる。なお、この際に修正ミスな
どがあり再修正が行われると、再修正結果のみを修正さ
れた文字コード列として記憶させる。また、認識結果修
正部31によるこの修正時、修正時入力量計数部35が実際
に修正作業として入力した処理量を計数する(S73)。
例えば、修正作業時にキーボード6により修正する文字
を入力する場合、キーボード6から入力した文字数(キ
ータッチ数)を計数するのである。こうして、修正が終
了すると、修正処理量計数部32が、認識結果記憶部33か
ら認識結果としての文字コード列を読み出し、修正結果
記憶部34から修正結果としての文字列を読み出し、2つ
の文字列を先頭から順次比較することにより修正された
文字数を計数する(S74)。このように、この実施例に
よれば、認識結果を修正する際、修正する前と後の文字
認識結果データが1文字づつ比較され、修正された文字
数が修正データ量として計数されるので、正確な修正量
を計数することができ、したがって、修正に対する対価
としての正確な費用計算を行うことができる。また、実
際に修正作業として入力したデータ量が計数されるの
で、修正作業時のミスタイプ数などが把握でき、修正作
業時の作業効率を把握することができる。また、修正し
ていないデータ量を計数するようにした構成では、前記
のように、例えば文字認識処理の利用料を支払うシステ
ムにおいて、有効な処理量分だけの利用料計算を正確か
つ容易に実現することができる。
【0018】本発明の第10の実施例では、原稿上に記載
された文字を認識する際に認識する文字領域を原稿上に
存在する色と異なる色で指定させ、その文字領域にある
文字を認識する際、前記異なる色で一連の文字列を指定
させ、指定された一連の文字列からその文字列の属する
文字領域を自動抽出し、抽出された文字領域の文字を認
識する。例えば、図19(a)に示すような原稿について、
この中の文書番号と日付を認識させるために認識項目
(認識対象の文字列)をペンで指定する場合、図19(b)
に太線で示したように認識項目をきちんと包含する形で
領域を指定すれば問題ないが、図19(c)に示した太線の
ようにペンで指定した場合、どの文字を認識すればよい
のかわからない。ペンで描かれた線がかかった文字を認
識領域とすると、図示の例では文書番号も日付も先頭の
一文字が認識領域から外れてしまう。このような問題を
回避するために、本発明の第10の実施例では、図示の例
の文書番号欄のように周囲が枠で囲まれているような領
域の場合、ペンで指定した領域の外側に枠があるか否か
を調べ、枠がある場合には、図19(d)に太線で示したよ
うな枠線領域を抽出し、日付欄のように枠線がない場合
には、原稿中のレイアウトを解析し、図19(e)に太線で
示したような文字領域を抽出し、最終的には、図19(f)
に網掛け領域として示したような必要な文字領域だけを
抽出するようにする。図20に、この実施例の文字認識シ
ステム要部の構成ブロックを示す。図示したように、こ
の実施例の文字認識システムは、画像入力部11、原稿上
の文字列を他の部分とは異なった色で指定している線画
情報を抽出する色抽出部41、抽出された線画情報に基づ
いてその文字列の属する文字領域を抽出する文字領域抽
出部42、抽出された文字領域内の文字を認識する文字認
識部12aなどを備えている。なお、この文字認識システ
ムを実現するハードウェア構成は図14に示したとおりで
ある。また、前記色抽出部41および文字領域抽出部42は
CPU1およびRAM3などにより実現される。
【0019】図21に、第10の実施例の動作フローを示
す。以下、図10などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を原稿上から読み取り(S81)、色抽出部41
が、読み取られた画像情報中から所定の色の線画情報を
抽出する(S82)。例えば、その色が赤い色で指定され
ている場合であれば、画像情報中の赤い色の部分を抽出
するのである。なお、所定の色を抽出するには、例えば
カラーで入力された画像情報の各ドットに対して、RGB
(赤緑青)の各値が予め指定しておいた色の値と近い場
合、そのドットを同じ色と判定して抽出する。次に、文
字領域抽出部42が色抽出部41により抽出された色の場所
にある文字列を抽出する。そして、例えば、図19(a)に
示した原稿において、この中の文書番号と日付とが文字
認識対象の文字列(認識項目)として抽出されると、図
19(c)に太線で示したように指定された場合、ペンで指
定した文字列の外側に枠があるか否かを調べ、文書番号
欄のように指定された文字列の周囲が枠で囲まれている
ならば、図19(d)に太線で示したような枠線領域を認識
対象の文字領域として抽出し、日付欄のように枠線がな
い場合には、原稿中のレイアウトを解析し、図19(e)に
太線で示したような文字領域を抽出し、最終的には、図
19(f)の網掛け領域のように必要な文字領域だけを抽出
する(S83)。続いて、文字認識部12aが文字領域抽出
部42により抽出された文字領域中の文字を認識する(S
84)。例えば、特開平3−108079号公報に示されたよう
な認識方法 により文字認識を行うのである。こうし
て、この実施例によれば、文字認識領域を正しく抽出す
ることができるので、認識精度を向上させることができ
る。
【0020】本発明の第11の実施例では、原稿上に記載
された文字を認識する際に、認識する文字領域を原稿上
に存在する色と異なる色で指定させ、その文字領域にあ
る文字を認識する文字認識方法において、指定された文
字領域を自動抽出すると共に、指定された色に応じて、
認識対象文字の文字種を特定して文字認識を行う。図22
は、第11の実施例を示す文字認識システム要部の構成ブ
ロック図である。図示したように、この実施例の文字認
識システムは、第10の実施例の構成(図20参照)に加え
て認識文字種記憶部43を備え、文字認識部12aは色抽出
部41の抽出した色に対応付けられている文字種を認識文
字種記憶部43から取得し、その文字種に応じた文字認識
を行う。例えば、認識文字種記憶部43に、「赤:数字の
み、青:英字のみ、緑:全文字種」というように記憶し
ておくのでのである。図23に、第11の実施例の動作フロ
ーを示す。以下、図23などに従って、この実施例の動作
を説明する。まず、画像入力部11が認識対象文字の記載
された画像情報を原稿上から読み取り(S91)、色抽出
部41が、読み取られた画像情報中から所定の色の線画情
報を抽出する(S92)。例えば、その色が赤い色で指定
されている場合であれば、画像情報中の赤い色の部分を
抽出するのである。なお、所定の色を抽出するには、例
えばカラーで入力された画像情報の各ドットに対して、
RGB(赤緑青)の各値が予め指定しておいた色の値と近
い場合、そのドットを同じ色と判定して抽出する。次
に、第10の実施例と同様にして、文字領域抽出部42が色
抽出部41により抽出された色の場所の文字領域を抽出す
る(S93)。続いて、文字認識部12aが、色抽出部41に
より抽出された色に対応付けられた文字種を認識文字種
記憶部43から取得し(S94)、さらに、文字領域抽出部
42により抽出された文字領域中の文字を認識する(S9
5)。例えば、特開平3−108079号公報に示されたような
認識方法 により文字認識を行うのであるが、このと
き、候補文字として挙げられた文字が取得した文字種に
該当しないならば、その文字を候補文字から外す。こう
して、この実施例によれば、該当しない文字については
認識結果としての文字コードから外されるので、認識精
度を向上させることができる。
【0021】本発明の第12の実施例では、認識する文字
領域を原稿上に存在する色と異なる色で指定させて、そ
の文字領域にある文字を認識する際、指定された文字領
域を自動抽出すると共に、指定された色に応じて、文字
認識を行う際の認識処理方法を変更する。そのため、こ
の実施例の文書認識システムは、図24に示すように、第
10の実施例の構成(図20参照)に加えて複数の認識処理
方法を可能にする認識処理対応記憶部44を備え、文字認
識部12bは、指定された色に対応付けて認識処理対応記
憶部44に記憶されている認識処理方法で文字認識を行
う。例えば、認識処理対応記憶部44に、「赤:手書き、
青:活字」というように記憶しておき、色抽出部41によ
り「赤」が抽出されたならば、手書き文字認識用認識処
理方法を用いて文字認識を行い、「青」が抽出されたな
らば、活字文字認識用認識処理方法を用いて文字認識を
行うのである。図25に、第12の実施例の動作フローを示
す。以下、図25などに従って、この実施例の動作を説明
する。まず、画像入力部11が認識対象文字の記載された
画像情報を原稿上から読み取り(S101)、色抽出部41
が、読み取られた画像情報中から所定の色の線画情報を
抽出する(S102)。例えば、その色が赤い色で指定さ
れている場合であれば、画像情報中の赤い色の部分を抽
出するのである。なお、所定の色を抽出するには、例え
ばカラーで入力された画像情報の各ドットに対して、RG
B(赤緑青)の各値が予め指定しておいた色の値と近い
場合、そのドットを同じ色と判定して抽出する。次に、
第10の実施例と同様にして、文字領域抽出部42が色抽出
部41により抽出された色の場所の文字領域を抽出する
(S103)。続いて、文字認識部12bが、色抽出部41によ
り抽出された色に対応付けられた認識処理方法を設定す
る(S104)。例えば色抽出部41により抽出された色に
対応付けられた認識処理方法の処理プログラムを認識処
理対応記憶部44から読み出して起動するのである。そし
て、そのプログラムに従って、文字領域抽出部42により
抽出された文字領域中の文字を認識する(S105)。こ
うして、この実施例によれば、認識対象の文字に応じ
て、適切な文字認識処理方法を用いた文字認識ができる
ので、認識精度が向上する。
【0022】本発明の第13の実施例では、認識する文字
領域を原稿上に存在する色と異なる色で指定させて、そ
の文字領域にある文字を認識する際、指定された文字領
域を自動抽出すると共に、指定された色に応じて、文字
認識する項目の対応付けを行う。そのため、この実施例
の文書認識システムは、図26に示すように、第10の実施
例の構成(図20参照)に加えて認識項目毎に例えば認識
結果として可能な文字コードを制限するための情報を記
憶しておく認識項目対応記憶部45を備え、文字認識部12
cは、指定された色に対応付けて認識項目対応記憶部44
に記憶されている情報を用いて文字認識を行う。図27
に、第13の実施例の動作フローを示す。以下、図27など
に従って、この実施例の動作を説明する。まず、画像入
力部11が認識対象文字の記載された画像情報を原稿上か
ら読み取り(S111)、色抽出部41が、読み取られた画
像情報中から所定の色の線画情報を抽出する(S11
2)。例えば、その色が赤い色で指定されている場合で
あれば、画像情報中の赤い色の部分を抽出するのであ
る。なお、所定の色を抽出するには、例えばカラーで入
力された画像情報の各ドットに対して、RGB(赤緑青)
の各値が予め指定しておいた色の値と近い場合、そのド
ットを同じ色と判定して抽出する。次に、第10の実施例
と同様にして、文字領域抽出部42が色抽出部41により抽
出された色の場所の文字領域を抽出する(S113)。続
いて、文字認識部12cが、色抽出部41により抽出された
色に対応付けられた各認識項目を設定し(S114)、設
定された認識項目に対応付けられた情報を認識項目対応
記憶部45から取得し、取得されたそれぞれの情報を用い
て文字領域抽出部42により抽出された各文字領域中の文
字を認識する(S115)。例えば、認識項目対応記憶部4
5に、「赤:文書番号、青:日付」というように記憶し
ておき、文字認識部12cは、色抽出部41により「赤」が
抽出された文字領域については認識結果としての文字コ
ードを番号数字だけに限定し、「青」が抽出された文字
領域については認識結果としての文字コードを数字およ
び年月日という文字だけに限定する。こうして、この実
施例によれば、認識項目の文字に応じて、認識結果とし
ての文字コードが限定されるので、認識精度が向上す
る。
【0023】本発明の第14の実施例では、第10乃至第13
記載の文字認識方法のうちの少なくとも2つの方法を組
み合わせた方法で文字認識を行う。そのため、この実施
例の文書認識システムは、図28に示すように、例えば、
第10の実施例の構成(図20参照)に加えて色対応記憶部
46を備え、文字認識部12dは、指定された色に対応付け
て色対応記憶部46に記憶されている情報を用いて文字認
識を行う。図29に、第14の実施例の動作フローを示す。
以下、図29などに従って、この実施例の動作を説明す
る。まず、画像入力部11が認識対象文字の記載された画
像情報を原稿上から読み取り(S121)、色抽出部41
が、読み取られた画像情報中から所定の色の線画情報を
抽出する(S122)。例えば、その色が赤い色で指定さ
れている場合であれば、画像情報中の赤い色の部分を抽
出するのである。なお、所定の色を抽出するには、例え
ばカラーで入力された画像情報の各ドットに対して、RG
B(赤緑青)の各値が予め指定しておいた色の値と近い
場合、そのドットを同じ色と判定して抽出する。次に、
第10の実施例と同様にして、文字領域抽出部42が色抽出
部41により抽出された色の場所の文字領域を抽出する
(S123)。続いて、文字認識部12dが、色抽出部41によ
り抽出された色に対応付けられた例えば各認識項目を設
定し(S124)、設定された認識項目に対応付けられた
情報を色対応記憶部46から取得し、取得されたそれぞれ
の情報を用いて文字領域抽出部42により抽出された各文
字領域中の文字を認識する(S125)。例えば、色対応
記憶部46に、「赤:認識方法;手書き,文字種;数字,
項目;文書番号、青:認識方法;活字,文字種;数字+
漢字,項目;日付」というように記憶しておき、文字領
域抽出部42により抽出された各文字領域毎に色対応記憶
部46に記憶されている前記情報を用いて、認識方法、認
識文字種などを切り替えたり、認識した結果を認識項目
と対応付ける。こうして、この実施例によれば、認識項
目の文字に応じて、認識結果としての文字コードがさら
に限定されるので、認識精度がさらに向上する。なお、
第11乃至第14の実施例では、文字領域抽出部42は抽出さ
れた線画情報に基づいてその文字列の属する文字領域を
抽出しているが、従来技術と同様に、線画情報で示され
た枠そのものを文字領域の境界線として文字領域を抽出
してもよい。また、以上においては、各実施例で示した
構成の文字認識システムを用いた場合で説明したが、説
明したような文字認識方法に従ってプログラミングした
プログラムを例えば着脱可能な記憶媒体に記憶し、その
記憶媒体をこれまで本発明によった文字認識を行えなか
ったパーソナルコンピュータなど情報処理装置に装着す
ることにより、その情報処理装置において本発明による
文字認識を行うこともできる。
【0024】
【発明の効果】以上説明したように、本発明によれば、
請求項1記載の発明では、認識結果として出力した文字
コードが、置換される文字コードとして認識結果置換情
報中に登録されている文字コードであった場合、その文
字コードがその認識結果置換情報に従って他の文字コー
ドに置換されるので、例えば含まれるはずのない文字を
類似の含まれる文字に置換するように認識結果置換情報
に登録して自動的に文字置換を行い、より効率的に精度
の良い出力結果を得ることができる。また、請求項2記
載の発明では、認識結果として出力した文字コードが、
削除される文字コードとして認識結果削除情報中に登録
されている文字コードであった場合、その文字コードが
認識結果情報中から削除されるので、含まれるはずのな
い例えば紙の汚れを文字として認識したような文字を削
除するように認識結果削除情報に登録して自動的に削除
を行い、より効率的に精度の良い出力結果を得ることが
できる。また、請求項3記載の発明では、認識結果とし
て出力した文字コードが、削除される文字コードとして
認識結果候補削除情報中に登録されている文字コードで
あった場合、その文字コードが認識結果として出力され
た候補文字中から削除されるので、例えば含まれるはず
のない文字を候補文字中から削除するように認識結果候
補削除情報に登録して自動的に削除を行い、より効率的
に精度の良い出力結果を得ることができる。また、請求
項4記載の発明では、認識結果として出力した文字コー
ドが、順番が置換される文字コードとして認識結果候補
置換情報中に登録されている文字コードであった場合、
その認識結果候補置換情報に従い、複数の候補文字中の
その文字コードの順番が置換されるので、例えば含まれ
る可能性の少ない文字については候補文字中の順番を後
ろへ移動させるような置換を行うように認識結果候補置
換情報に登録して自動的に置換を行い、より効率的に精
度の良い出力結果を得ることができる。
【0025】また、請求項5記載の発明では、請求項1
乃至請求項4記載の発明において、認識結果情報中に含
まれる認識の確信度情報により、認識結果の変換を行う
か否かが判定されるので、確信度が低い場合にだけ文字
認識結果が変換されるようにすることにより、例えば例
外的に通常は用いない文字を用いたような場合に意図に
反して誤った文字に変換されてしまうというようなこと
がなくなる。また、請求項6記載の発明では、請求項1
乃至請求項5記載の文字認識方法に従って文字認識を行
う文字認識装置において、認識結果置換情報、認識結果
削除情報、認識結果候補削除情報、または認識結果候補
置換情報を入力し、入力した情報を記憶することができ
るので、利用者が所望の変換情報を入力し、入力した変
換情報に従って文字認識結果の変換を行うようにして、
用途に合った文字認識を行うことができ、したがって、
さらに精度の良い文字認識結果を得ることができる。ま
た、請求項7記載の発明では、修正する前と後の文字認
識結果データを比較することにより、修正したデータ量
および/または修正しなかったデータ量が計数されるの
で、修正したデータ量を計数する構成では、正確な修正
量を計数することができ、したがって、修正に対する対
価としての正確な費用計算などを行うことができるし、
修正していないデータ量を計数する構成では、例えば文
字認識処理の利用料を支払うシステムにおいて、有効な
処理量分だけの利用料計算を正確かつ容易に実現するこ
とができる。また、請求項8記載の発明では、請求項7
記載の発明において、文字認識結果を修正する際に実際
に入力したデータ量も計数されるので、さらに、修正作
業時のミスタイプ数などが把握でき、修正作業時の作業
効率を把握することができる。また、請求項9記載の発
明では、原稿上に記載された文字を認識する際、利用者
により、原稿上に存在する色とは異なる色で認識対象の
文字列が指定され、指定された一連の文字列からその文
字列の属する文字領域が自動抽出され、抽出された文字
領域の文字が認識されるので、正しい文字認識領域に対
して文字認識を行うことができ、したがって、認識精度
を向上させることができる。
【0026】また、請求項10記載の発明では、原稿上に
記載された文字を認識する際、原稿上に存在する色とは
異なる色で行われる利用者の文字認識対象指定に従って
文字認識の行われる文字領域が自動抽出されると共に、
指定された色に応じて認識対象文字の文字種が特定さ
れ、文字認識が行われるので、該当しない文字種につい
ては認識結果としての文字コードから外すことができ、
したがって、認識精度を向上させることができる。ま
た、請求項11記載の発明では、原稿上に記載された文字
を認識する際、原稿上に存在する色とは異なる色で行わ
れる利用者の文字認識対象指定に従って文字認識の行わ
れる文字領域が自動抽出されると共に、指定された色に
応じて文字認識を行う際の認識処理方法が変更されるの
で、認識対象の文字に応じて適切な文字認識処理方法を
用いた文字認識を行うことができ、したがって、認識精
度を向上させることができる。また、請求項12記載の発
明では、原稿上に記載された文字を認識する際、原稿上
に存在する色とは異なる色で行われる利用者の文字認識
対象指定に従って文字領域指定の行われる文字領域が自
動抽出されると共に、指定された色に応じて文字認識す
る複数の項目の対応付けが行われるので、認識項目の文
字に応じて、認識結果としての文字コードを限定するこ
とができ、したがって、認識精度を向上させることがで
きる。また、請求項13記載の発明では、請求項9乃至請
求項12記載の文字認識方法のうちの少なくとも2つの方
法が組み合わされた方法で文字認識が行われるので、例
えば認識結果としての文字コードをさらに限定すること
ができ、したがって、認識精度をさらに向上させること
ができる。また、請求項14記載の発明では、請求項1乃
至請求項5、請求項7乃至請求項13記載の文字認識方法
のうちのいずれかに従ってプログラミングしたプログラ
ムが例えば着脱可能な記憶媒体に記憶されるので、その
記憶媒体をこれまで請求項1乃至請求項5、請求項7乃
至請求項13記載の発明による文字認識を行えなかったパ
ーソナルコンピュータなど情報処理装置に装着すること
により、その情報処理装置において請求項1乃至請求項
5、請求項7乃至請求項13記載の発明の効果を得ること
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例を示す文字認識システム
の構成ブロック図である。
【図2】本発明の第1の実施例を示す文字認識方法の動
作フロー図である。
【図3】本発明の第2の実施例を示す文字認識システム
の構成ブロック図である。
【図4】本発明の第2の実施例を示す文字認識方法の動
作フロー図である。
【図5】本発明の第3の実施例を示す文字認識システム
の構成ブロック図である。
【図6】本発明の第3の実施例を示す文字認識方法の動
作フロー図である。
【図7】本発明の第4の実施例を示す文字認識システム
の構成ブロック図である。
【図8】本発明の第4の実施例を示す文字認識方法の動
作フロー図である。
【図9】本発明の第5の実施例を示す文字認識システム
の構成ブロック図である。
【図10】本発明の第6の実施例を示す文字認識システ
ムの構成ブロック図である。
【図11】本発明の第6の実施例を示す文字認識方法の
動作フロー図である。
【図12】本発明の第7の実施例を示す文字認識システ
ムの構成ブロック図である。
【図13】本発明の第7の実施例を示す文字認識方法の
動作フロー図である。
【図14】本発明の各実施例の文字認識システムのハー
ドウェア構成を示す構成ブロック図である。
【図15】本発明の第8の実施例を示す文字認識システ
ムの構成ブロック図である。
【図16】本発明の第8の実施例を示す文字認識方法の
動作フロー図である。
【図17】本発明の第9の実施例を示す文字認識システ
ムの構成ブロック図である。
【図18】本発明の第9の実施例を示す文字認識方法の
動作フロー図である。
【図19】本発明の第10の実施例を示す文字認識方法の
説明図である。
【図20】本発明の第10の実施例を示す文字認識システ
ムの構成ブロック図である。
【図21】本発明の第10の実施例を示す文字認識方法の
動作フロー図である。
【図22】本発明の第11の実施例を示す文字認識システ
ムの構成ブロック図である。
【図23】本発明の第11の実施例を示す文字認識方法の
動作フロー図である。
【図24】本発明の第12の実施例を示す文字認識システ
ムの構成ブロック図である。
【図25】本発明の第12の実施例を示す文字認識方法の
動作フロー図である。
【図26】本発明の第13の実施例を示す文字認識システ
ムの構成ブロック図である。
【図27】本発明の第13の実施例を示す文字認識方法の
動作フロー図である。
【図28】本発明の第14の実施例を示す文字認識システ
ムの構成ブロック図である。
【図29】本発明の第14の実施例を示す文字認識方法の
動作フロー図である。
【符号の説明】
1 CPU 3 RAM 5 ハードディスク装置 11 画像入力部 12 文字認識部 13 認識結果置換部 14 認識結果置換情報記憶部 15 認識結果削除部 16 認識結果削除情報記憶部 17 認識結果候補削除部 18 認識結果候補削除情報記憶部 19 認識結果候補置換部 20 認識結果候補置換情報記憶部 21 認識結果変換部 22 認識結果変換情報記憶部 23 認識結果変換判断部 24 変換情報入力部 31 認識結果修正部 32 修正処理量計数部 33 認識結果記憶部 34 修正結果記憶部 35 修正時入力量記億部 41 色抽出部 42 文字領域抽出部 43 認識文字種記憶部 44 認識処理対応記憶部 45 認識項目対応記憶部 46 色対応記憶部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 9/20 360 G06K 9/20 360C 9/62 610 9/62 610B 610C

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 画像情報として与えられた文字を認識対
    象にして文字認識を行い、認識した文字の文字コードを
    含む認識結果を出力する文字認識方法において、認識結
    果として出力した文字コードが、置換される文字コード
    として認識結果置換情報中に登録されている文字コード
    であった場合、その文字コードを前記認識結果置換情報
    に従って他の文字コードに置換することを特徴とする文
    字認識方法。
  2. 【請求項2】 画像情報として与えられた文字を認識対
    象にして文字認識を行い、認識した文字の文字コードを
    含む認識結果を出力する文字認識方法において、認識結
    果として出力した文字コードが、削除される文字コード
    として認識結果削除情報中に登録されている文字コード
    であった場合、その文字コードを認識結果情報中から削
    除することを特徴とする文字認識方法。
  3. 【請求項3】 画像情報として与えられた文字を認識対
    象にして文字認識を行い、認識した上位候補文字の文字
    コードを含む認識結果を出力する文字認識方法におい
    て、認識結果として出力した文字コードが、削除される
    文字コードとして認識結果候補削除情報中に登録されて
    いる文字コードであった場合、その文字コードを認識結
    果として出力された候補文字中から削除することを特徴
    とする文字認識方法。
  4. 【請求項4】 画像情報として与えられた文字を認識対
    象にして文字認識を行い、認識した上位候補文字の文字
    コードを含む認識結果を出力する文字認識方法におい
    て、認識結果として出力した文字コードが、順番が置換
    される文字コードとして認識結果候補置換情報中に登録
    されている文字コードであった場合、その文字コードを
    前記認識結果候補置換情報に従い、候補の順番を置換す
    ることを特徴とする文字認識方法。
  5. 【請求項5】 請求項1乃至請求項4記載の文字認識方
    法において、認識結果情報中に含まれる認識の確信度情
    報を用いて、認識結果の変換を行うか否かを判定するこ
    とを特徴とする文字認識方法。
  6. 【請求項6】 請求項1乃至請求項5記載の文字認識方
    法に従って文字認識を行う文字認識装置において、認識
    結果置換情報、認識結果削除情報、認識結果候補削除情
    報、または認識結果候補置換情報を入力させる変換情報
    入力手段と、前記変換情報入力手段により入力された情
    報を記憶しておく認識結果変換情報記憶手段とを備えた
    ことを特徴とする文字認識装置。
  7. 【請求項7】 画像情報として与えられた文字を認識対
    象にして文字認識を行い、文字認識結果を修正する文字
    認識方法において、修正する前と後の文字認識結果デー
    タを比較し、修正したデータ量および/または修正しな
    かったデータ量を計数することを特徴とする文字認識方
    法。
  8. 【請求項8】 請求項7記載の文字認識方法において、
    文字認識結果を修正する際に実際に入力したデータ量も
    計数することを特徴とする文字認識結果修正方法。
  9. 【請求項9】 原稿上に記載された文字を認識する際に
    認識する文字領域を原稿上に存在する色と異なる色で指
    定させ、その文字領域にある文字を認識する文字認識方
    法において、前記異なる色で一連の文字列を指定させ、
    指定された一連の文字列からその文字列の属する文字領
    域を自動抽出し、抽出された文字領域の文字を認識する
    ことを特徴とする文字認識方法。
  10. 【請求項10】 原稿上に記載された文字を認識する際
    に認識する文字領域を原稿上に存在する色と異なる色で
    指定させ、その文字領域にある文字を認識する文字認識
    方法において、文字認識を行う文字領域を自動抽出する
    と共に、指定された色に応じて認識対象文字の文字種を
    特定して文字認識を行うことを特徴とする文字認識方
    法。
  11. 【請求項11】 原稿上に記載された文字を認識する際
    に認識する文字領域を原稿上に存在する色と異なる色で
    指定させ、その文字領域にある文字を認識する文字認識
    方法において、文字認識を行う文字領域を自動抽出する
    と共に、指定された色に応じて文字認識を行う際の認識
    処理方法を変更することを特徴とする文字認識方法。
  12. 【請求項12】 原稿上に記載された文字を認識する際
    に認識する文字領域を原稿上に存在する色と異なる色で
    指定させ、その文字領域にある文字を認識する文字認識
    方法において、文字認識を行う文字領域を自動抽出する
    と共に、指定された色に応じて文字認識する複数の項目
    の対応付けを行うことを特徴とする文字認識方法。
  13. 【請求項13】 原稿上に記載された文字を認識する際
    に認識する文字領域を原稿上に存在する色と異なる色で
    指定させ、その文字領域にある文字を認識する文字認識
    方法において、請求項9乃至請求項12記載の文字認識方
    法のうちの少なくとも2つの方法を組み合わせた方法で
    文字認識を行うことを特徴とする文字認識方法。
  14. 【請求項14】 請求項1乃至請求項5、請求項7乃至
    請求項13のいずれか1つの請求項に記載の文字認識方法
    を実施するためのプログラムを記憶したことを特徴とす
    る記憶媒体。
JP2000131854A 2000-04-28 2000-04-28 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体 Pending JP2001312693A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000131854A JP2001312693A (ja) 2000-04-28 2000-04-28 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000131854A JP2001312693A (ja) 2000-04-28 2000-04-28 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008024280A Division JP2008140417A (ja) 2008-02-04 2008-02-04 文字認識方法

Publications (1)

Publication Number Publication Date
JP2001312693A true JP2001312693A (ja) 2001-11-09

Family

ID=18640673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000131854A Pending JP2001312693A (ja) 2000-04-28 2000-04-28 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体

Country Status (1)

Country Link
JP (1) JP2001312693A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012157252A1 (ja) 2011-05-17 2012-11-22 パナソニック株式会社 文字列抽出方法と文字列抽出装置
JP2017045324A (ja) * 2015-08-27 2017-03-02 沖電気工業株式会社 データ入力システム、データ入力方法、及び、プログラム
JP2018152111A (ja) * 2018-05-14 2018-09-27 株式会社ニチリョー ピペット個体管理のためのシステム、方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012157252A1 (ja) 2011-05-17 2012-11-22 パナソニック株式会社 文字列抽出方法と文字列抽出装置
WO2012157253A1 (ja) 2011-05-17 2012-11-22 パナソニック株式会社 冷蔵庫の解体方法と冷蔵庫の解体装置および、家電製品の解体方法と家電製品の解体装置
JP5168435B2 (ja) * 2011-05-17 2013-03-21 パナソニック株式会社 文字列抽出方法と文字列抽出装置
CN103548036A (zh) * 2011-05-17 2014-01-29 松下电器产业株式会社 字符串提取方法和字符串提取装置
CN103548036B (zh) * 2011-05-17 2014-10-22 松下电器产业株式会社 字符串提取方法和字符串提取装置
JP2017045324A (ja) * 2015-08-27 2017-03-02 沖電気工業株式会社 データ入力システム、データ入力方法、及び、プログラム
JP2018152111A (ja) * 2018-05-14 2018-09-27 株式会社ニチリョー ピペット個体管理のためのシステム、方法及びプログラム

Similar Documents

Publication Publication Date Title
US7305129B2 (en) Methods and apparatus for populating electronic forms from scanned documents
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JP4998219B2 (ja) 帳票認識プログラム、帳票認識装置および帳票認識方法
JP4742404B2 (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
KR100412317B1 (ko) 문자인식/수정방법및장치
JP3294995B2 (ja) 帳票読取装置
JP4977368B2 (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2005216203A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
JP2001312693A (ja) 文字認識装置、文字認識方法およびその方法を実施するためのプログラムを記憶した記憶媒体
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP2008140417A (ja) 文字認識方法
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
JP2001052112A (ja) 認識処理方法、情報処理装置および記録媒体
JPH11219394A (ja) 財務諸表自動入力装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2021152696A (ja) 情報処理装置及びプログラム
JP3190603B2 (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JP3000349B2 (ja) キー入力編集方法及び編集装置
WO2001026024A1 (fr) Dispositif et procede d'identification de document
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体
JPH0562008A (ja) 文字認識方法
JP2004341754A (ja) 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP3481850B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041221

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080708