JP3957848B2 - COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY - Google Patents
COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY Download PDFInfo
- Publication number
- JP3957848B2 JP3957848B2 JP35851997A JP35851997A JP3957848B2 JP 3957848 B2 JP3957848 B2 JP 3957848B2 JP 35851997 A JP35851997 A JP 35851997A JP 35851997 A JP35851997 A JP 35851997A JP 3957848 B2 JP3957848 B2 JP 3957848B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- threshold
- character
- area
- recognition area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、端末と中央制御装置間で通信を行う通信システム及びその制御方法、コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】
一般に、文字認識装置を有する端末は、端末における文字認識結果を中央制御装置に転送し、そこで、文字認識結果の誤り訂正、検索、保存などの後処理を行う。この際、端末側で文字認識候補の精度が低いと判定した場合は、その文字認識候補を認識不能として所定の識別子(以下、リジェクトコードと称する)を中央制御装置へ送信し、認識不能である旨を知らせていた。
【0003】
リジェクトコードは、個々の認識侯補文字の確からしさ(以下、類似度と称する)を算出し、それが所定の閾値より低い場合に、認識不能と判定される。従って、図4に示すように、一般にリジェクトコードが発生する度合い(以下、リジェクト率と称する)が高い場合、即ち、類似度の閾値が高い場合、相対的に認識可能と判断される文字の類似度が高くなりその正解率も高い。反対に、リジェクト率が低い場合は、認識可能と判断されてもその文字の正解率は低くなる傾向にある。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の端末と中央制御装置間で通信を行う通信システムでは、リジェクト率は通信システム固有のもの、即ち、類似度の閾値が固定である。そのため、例えば、端末の認識対象である原稿画像内に異なるフォントの文字が混在して認識精度が同一原稿画像内で大きく変化してしまう場合、中央制御装置側としてはそれに対しなんら対処することができず、後処理の効率低下は免れなかった。
【0005】
本発明は上記の問題点に鑑みてなされたものであり、文字認識を行う端末と中央制御装置間で通信を行う通信システムにおいて、処理効率を向上することができる通信システム及びその制御方法、コンピュータ可読メモリを提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的を達成するための本発明による通信システムは以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムであって、
前記端末は、
原稿を画像データとして読み取る読取手段と、
前記読取手段で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識手段と、
前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識手段で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信手段と、
前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定手段と、を備え、
前記中央制御装置は、
前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信手段と、
前記文字認識結果受信手段で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御手段と、
前記閾値制御手段で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信手段と、
を備える。
【0007】
また、好ましくは、前記閾値制御手段は、前記文字認識結果受信手段で受信した前記文字認識結果に基づいて、当該認識領域内で認識不能と判断された文字数が前記第1閾値未満かつ前記第2閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた前記認識不能判定用閾値が適当な値であると決定する。
【0013】
上記の目的を達成するための本発明による通信システムの制御方法は以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムの制御方法であって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
を備える。
【0014】
上記の目的を達成するための本発明によるコンピュータ可読メモリは以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムの制御をコンピュータに実行させるためのプログラムを記録したコンピュータ可読メモリであって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0015】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
【0016】
図1は本発明の実施形態の通信システムの構成を示す図である。
【0017】
図1に示すように、通信システムは移動端末100と中央制御装置200から構成される。また、移動端末100と中央制御装置200は無線ネットワーク300を通して結ばれている。尚、ここでは、1台の移動端末100と中央制御装置200で構成されているが、移動端末100を複数構成した場合にも、本発明は適用される。そして、複数の移動端末100の各移動端末が中央制御装置200と通信を行う場合には、各移動端末を識別できるように、例えば、互いに異なる識別信号を中央制御装置200に発行してから通信を開始することで、中央制御装置200は各移動端末を識別することができる。
【0018】
移動端末100において、102は読取原稿である。104は読取原稿102を読み取り、画像信号を生成するスキャナである。106はスキャナ104で生成された画像信号の認識領域を認識し、その認識された認識領域に対し文字認識を認識用辞書106aを用いて行う文字認識部である。106bは文字認識部106が出力する文字認識候補文字が認識不能であるか否かを認識不能判定用閾値に基づいて判定する認識不能判定部である。108は文字認識部106による文字認識結果及び認識領域を示す位置情報を中央制御装置200へ送信する文字認識結果送信部である。110は画像信号の認識領域を示す位置情報と、その認識領域の認識不能判定用閾値とを中央制御装置200より受信する閾値・位置情報受信部である。
【0019】
中央制御装置200において、202は文字認識結果及び位置情報を移動端末100より受信する文字認識結果受信部である。208は文字認識結果受信部202で受信した文字認識結果の後処理を行う文字認識結果後処理部である。208aは文字認識結果後処理部208による処理結果等のデータを保存する保存部である。210は文字認識結果後処理部208による処理結果を表示する表示部である。204は文字認識結果受信部202で受信された位置情報が示す認識対象の画像信号中の各認識領域の文字認識結果の多寡を判定し、移動端末100の認識不能判定部106bにおける各認識領域の最適な認識不能判定用閾値を設定する閾値制御部である。206は閾値制御部204で設定された画像信号中の各認識領域の位置情報及び認識不能判定用閾値を移動端末100へ送信する閾値・位置情報送信部である。
【0020】
尚、移動端末100、中央制御装置200には、それぞれ不図示のCPU、RAM、ROMが搭載されており、各端末に搭載されるCPUは、ROMに記憶されている装置を制御するための各種プログラムをRAMに展開して実行する。また、RAMはデータの作業領域、一時退避領域としても機能する。
【0021】
次に、本実施形態の通信システムの動作について、図1を用いて説明する。
【0022】
移動端末100側で準備された読取原稿102は、スキャナ104にて読取原稿102に対応する画像信号を生成する。生成した画像信号は文字認識部106に送られ、認識領域を認識し、その認識された認識領域の文字認識を行う。閾値・位置情報受信部110は、無線ネットワーク300を介して、中央制御装置200の閾値制御部204において設定された認識対象の画像信号中の各認識領域の位置情報及び認識不能判定用閾値を受信する。ここで、文字認識部106では、閾値・位置情報受信部110が受信した画像信号中の各認識領域の認識不能判定用閾値と、その各認識領域内の認識候補文字の類似度を比較する。比較の結果、認識不能判定用閾値よりも認識候補文字の類似度が大きい場合は、その認識候補文字に対応する文字コードを認識結果として出力する。一方、認識不能判定用閾値より認識候補文字の類似度が小さい場合は、認識不能として所定のリジェクトコードを出力する。尚、文字認識部106で実行される処理の詳細については、後述する。文字認識結果送信部108は、文字認識部106による文字認識結果である文字コード及び認識不能を示すリジェクトコード、認識領域を示す位置情報を中央制御装置200に無線ネットワーク300を介して送信する。
【0023】
一方、中央制御装置200では、まず、移動端末100から送信された文字認識結果及び位置情報を文字認識結果受信部202において受信する。受信した文字認識結果は、文字認識結果後処理部208で訂正、保存部208aの保存、文字認識結果をキーにした保存部208aに保存されているデータの検索等の処理を行い、その処理結果を表示部210に表示する。閾値制御部204では、受信した位置情報が示す各認識領域の文字認識結果に基づいて、各認識領域に最適な認識不能判定用閾値を設定する。尚、閾値制御部204で実行される処理の詳細については、後述する。閾値制御部204で設定した認識対象の画像信号の各認識領域の認識不能判定用閾値及び位置情報は、閾値・位置情報送信部206により移動端末100へ無線ネットワーク300を介して送信する。
【0024】
次に、本発明で実行される処理について、図2、図3を用いて説明する。尚、ここでは、特に、本発明の主眼となる文字認識部106及び閾値制御部204で実行される処理の詳細について説明する。
【0025】
図2は本発明の実施形態の文字認識部で実行される処理を示すフローチャートである。
【0026】
まず、ステップS300で、移動端末100内の文字認識部106は、スキャナ104から入力された画像信号から文字を切り出す文字抽出を行う。ステップS301で、画像信号中の認識領域を認識する。そして、認識された認識領域に基づいて、ステップS300で抽出された文字が、どの認識領域に属するかを判別する。ステップS302で、ステップS300で抽出された文字から所定の特徴抽出を行う。ステップS304で、認識対象文字と認識用辞書106a内の学習文字との類似度をステップS302で抽出された特徴を元に算出する。ステップS306で、認識候補文字をその類似度の大きい方から所定の数(認識候補文字数)だけ選択し、ソーティングする。また、この候補文字数は、認識候補文字数レジスタ(不図示)にセットされる。
【0027】
ステップS308で、認識不能判定部106bによって、認識候補文字の第1候補、即ち、類似度が最も大きい認識候補文字の類似度と、その認識候補文字が含まれる認識領域の認識不能判定用閾値とを比較する。第1候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より小さい場合(ステップS308でNO)、ステップS310に進み、認識対象文字を認識不能として、所定の識別子、即ち、リジェクトコードを出力する。一方、第1候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より大きい場合(ステップS308でYES)、最低1個の文字認識結果は出力できるので、認識成功として、ステップS312に進む。
【0028】
ステップS312で、認識候補文字の処理数をカウントする認識候補文字数カウンタi(不図示)に2を代入する。ステップS314で、認識侯補文字数カウンタiの内容が、認識候補文字数レジスタにセットされた認識候補文字数を超えたか否かを判定する。認識候補文字数カウンタの内容が認識候補文字数を超えている場合(ステップS314でYES)、それ以上の認識候補文字はないので以後の処理を中止し、ステップS316に進む。そして、ステップS316で、類似度が認識不能判定用閾値を超えている認識候補文字に対応する文字コードをすべて出力する。一方、認識候補文字数カウンタiの内容が候補文字数を越えていない場合(ステップS314でNO)、ステップS318へ進む。
【0029】
ステップS318で、第i候補の類似度と、その認識候補文字が含まれる認識領域の認識不能判定用閾値とを比較する。第i候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より小さい場合(ステップS318でNO)、第i候補以降の候補文字は認識不能として、ステップS316に進む。一方、第i候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より大きい場合(ステップS318でYES)、ステップS320に進み、認識候補文字数カウンタiをインクリメントし、ステップS314に戻る。
【0030】
尚、認識候補文字数レジスタ、認識候補文字数カウンタは、それぞれ中央制御装置200において、例えば、装置に搭載されているRAM上で実現されたり、専用のハードウェアで構成することで実現される。
【0031】
以上の処理によって、画像信号の各認識領域において判定されたリジェクト率は図4に示すような傾向を持つ。即ち、リジェクト率が高い場合は、認識可能と判断された文字の正解率は向上するが、その絶対数は少ない。逆に、リジェクト率が低い場合は、認識可能と判断される文字数は多いが、文字の正解率も低下する。そこで、本発明では、最適なリジェクト率で移動端末100での文字認識が実行されるように、移動端末100の文字認識部106の各認識領域の文字認識結果に基づいて、画像信号の各認識領域の最適な認識不能判定用閾値を中央制御装置200の閾値制御部204で再設定する。
【0032】
図3は本発明の実施形態の閾値制御部で実行される処理を示すフローチャートである。
【0033】
ステップS400で、画像信号中の処理対象の認識領域を示す認識領域ポインタiを初期化する。また、画像信号中の各認識領域には、番号が順番に付加され、認識領域ポインタiが示す値に従って、各認識領域の処理を行う。更に、画像信号中の認識領域数が認識領域数レジスタに記憶される。ステップ402で、文字認識結果受信部202で受信された文字認識結果及び位置情報に基づいて、認識領域ポインタiが示す第i領域に対応する認識領域の認識不能文字数(リジェクトコード)が第1の閾値TH1以上である否かを判定する。認識不能文字数が第1の閾値TH1以上である場合(ステップS402でYES)、移動端末100のスキャナ104の第i領域に対応する認識領域の読み取り状態が何らかの理由で悪化したと判断し、ステップS406へ進む。そして、ステップ406で、認識可能文字数を増加させるために、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値よりも減少させた認識不能判定用閾値を再設定する。その後、処理を終了する。
【0034】
一方、第i領域に対応する認識領域の認識不能文字数が第1の閾値TH1未満である場合(ステップS402でNO)、ステップS404に進む。ステップS404で、認識不能文字数が第2の閾値TH2(<TH1)未満であるか否かを判定する。認識不能文字数が第2の閾値TH2未満である場合(ステップS404でYES)、文字認識結果の正解率が悪化したと判断し、ステップ408へ進む。そして、ステップ408で、認識結果の正解率を向上させるために、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値よりも増加させた認識不能判定用閾値を再設定する。その後、処理を終了する。
【0035】
一方、第i領域に対応する認識領域の認識不能文字数が第2の閾値TH2以上である場合(ステップS404でNO)、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値が適当であると判断し、処理を終了する。
【0036】
ステップS410で、画像信号中の認識領域のすべてについて、認識不能判定用閾値の設定が終了したか否かを判定する。つまり、認識領域ポインタiが示す値と認識領域数レジスタに記憶される値が同じであるか否かを判定する。認識不能判定用閾値の設定が終了した場合(ステップS410でYES)、処理を終了する。一方、認識不能判定用閾値の設定が終了していない場合(ステップS410でNO)、ステップS412に進む。ステップS412で、認識領域ポインタiの値を1つ進め、ステップS402に戻る。
【0037】
尚、認識領域ポインタ、認識領域数レジスタは、それぞれ中央御装置200において、例えば、装置に搭載されているRAM上で実現されたり、専用のハードウェアで構成することで実現される。
【0038】
以上説明したように本発明によれば、中央制御装置200が移動端末100より入力された文字認識結果及び認識領域に基づいて、移動端末100で入力された画像信号の各認識領域毎に最適な認識不能判定用閾値を設定することができるので、各認識領域の認識精度を向上することができる。特に、処理対象の同一読取原稿内で筆記者の異なる文字、あるいは異なるフォントが混在するような場合、あるいは読取原稿のフォーマットが変化した場合でも、その読取原稿に対する文字認識を精度良く行うことができ、処理の効率を大幅に向上させることができる。
【0039】
上記実施形態では、移動端末100の文字認識部106が出力する認識候補文字数を複数としたが、これに限定されない。例えば、類似度が最も大きい認識候補文字を唯一の認識候補文字とし、それに対し認識不能判定部106bによる判定を行ってもよい。この場合、処理の高速化を図ることができる。
【0040】
上記実施形態では、無線ネットワーク300により結ばれた移動端末100、中央制御装置200から構成される通信システムを例に挙げて説明したが、これに限定されるものではない。例えば、有線ネットワークで結ばれた端末、中央制御装置で構成される通信システムでも何ら問題ない。
【0041】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0042】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0043】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0044】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0045】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0046】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0047】
【発明の効果】
以上説明したように、本発明によれば、文字認識を行う端末と中央制御装置間で通信を行う通信システムにおいて、処理効率を向上することができる通信システム及びその制御方法、コンピュータ可読メモリを提供できる。
【0048】
【図面の簡単な説明】
【図1】本発明の実施形態の通信システムの構成を示す図である。
【図2】本発明の実施形態の文字認識部で実行される処理を示すフローチャートである。
【図3】本発明の実施形態の閾値制御部で実行される処理を示すフローチャートである。
【図4】リジェクト率と認識文字精度の関係を示す図である。
【符号の説明】
100 端末
200 中央制御装置
300 無線ネットワーク
104 スキャナ
106 文字認識部
106a 認識用辞書
106b 認識不能判定部
108 文字認識結果送信部
110 閾値・位置情報受信部
202 文字認識結果受信部
204 閾値制御部
206 閾値・位置情報送信部
208 文字認識結果後処理部
208a 保存部
210 表示部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a communication system that performs communication between a terminal and a central control device, a control method thereof, and a computer-readable memory.
[0002]
[Prior art]
In general, a terminal having a character recognition device transfers a character recognition result at the terminal to a central control device, where post-processing such as error correction, search, and storage of the character recognition result is performed. At this time, if it is determined that the accuracy of the character recognition candidate is low on the terminal side, the character recognition candidate is unrecognizable and a predetermined identifier (hereinafter referred to as a reject code) is transmitted to the central control unit, which is not recognizable. I was informed.
[0003]
The reject code calculates the likelihood (hereinafter referred to as similarity) of each recognized supplementary character, and is determined to be unrecognizable when it is lower than a predetermined threshold. Therefore, as shown in FIG. 4, when the degree of occurrence of a reject code (hereinafter referred to as a rejection rate) is generally high, that is, when the similarity threshold is high, the similarity of characters that are determined to be relatively recognizable. The degree of accuracy increases and the accuracy rate is high. On the other hand, when the rejection rate is low, even if it is determined that recognition is possible, the accuracy rate of the character tends to be low.
[0004]
[Problems to be solved by the invention]
However, in the communication system in which communication is performed between the conventional terminal and the central control device, the rejection rate is unique to the communication system, that is, the similarity threshold is fixed. For this reason, for example, when characters of different fonts are mixed in the document image to be recognized by the terminal and the recognition accuracy changes greatly in the same document image, the central controller side can deal with it. It was not possible to avoid a reduction in post-processing efficiency.
[0005]
The present invention has been made in view of the above problems, and in a communication system that performs communication between a terminal that performs character recognition and a central controller, a communication system that can improve processing efficiency, a control method therefor, and a computer An object is to provide a readable memory.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, a communication system according to the present invention comprises the following arrangement. That is,
A communication system that performs communication between a terminal and a central controller,
The terminal
Reading means for reading a document as image data;
The image data read by the reading unit is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area by using a recognition dictionary. The recognition candidate character and its similarity are calculated, and when the calculated similarity is equal to or less than the recognition-unrecognition determination threshold of the recognition area, it is output as a character recognition result indicating that the recognition is impossible. A character recognition unit that outputs the recognition candidate character as a character recognition result when the recognition area is larger than the recognition-recognition determination threshold;
A character recognition result transmission means for transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition means for indicating the location of the region to,
When receiving the unrecognized determination threshold for resetting any of the recognition areas from the central control unit, reset the unrecognizable determination threshold for the recognition area with the unrecognizable determination threshold for resetting Threshold reception setting means for
The central controller is
A character recognition result receiving means for receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
Based on said character recognition result character recognition of the received by the receiving means and the position information indicating the position of each recognition area each character image in said each recognition area results for each of the recognition region, the recognition area When it is determined that the number of characters determined to be unrecognizable in step S1 is equal to or greater than the first threshold, a value lower than the threshold for determining unrecognition of the recognition area used when obtaining the character recognition result in the recognition area When it is determined that the number of characters determined to be unrecognizable in the recognition area is smaller than the second threshold and less than the second threshold, the recognition is determined. Threshold control means for determining, as the unrecognition determination threshold for resetting the recognition area, a value higher than the recognition unrecognition determination threshold of the recognition area used when obtaining the character recognition result in the area;
Threshold transmission means for transmitting to the terminal a threshold for determination of unrecognition for resetting the recognition area determined by the threshold control means;
Is provided.
[0007]
Preferably, the threshold control means is configured such that the number of characters determined to be unrecognizable within the recognition area based on the character recognition result received by the character recognition result receiving means is less than the first threshold and the second If it is determined that the threshold value is equal to or greater than the threshold value, it is determined that the unrecognizable determination threshold value used when obtaining the character recognition result in the recognition area is an appropriate value .
[0013]
In order to achieve the above object, a control method for a communication system according to the present invention comprises the following arrangement. That is,
A control method of a communication system for performing communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
Is provided.
[0014]
In order to achieve the above object, a computer readable memory according to the present invention comprises the following arrangement. That is,
A computer-readable memory storing a program for causing a computer to execute control of a communication system that performs communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A program for causing a computer to execute is recorded.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings.
[0016]
FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment of the present invention.
[0017]
As shown in FIG. 1, the communication system includes a
[0018]
In the
[0019]
In the
[0020]
Note that the
[0021]
Next, the operation of the communication system of this embodiment will be described with reference to FIG.
[0022]
The read original 102 prepared on the
[0023]
On the other hand, in the
[0024]
Next, processing executed in the present invention will be described with reference to FIGS. Here, in particular, details of processing executed by the
[0025]
FIG. 2 is a flowchart showing processing executed by the character recognition unit according to the embodiment of the present invention.
[0026]
First, in step S300, the
[0027]
In step S308, the recognition-
[0028]
In step S312, 2 is substituted into a recognition candidate character number counter i (not shown) for counting the number of recognition candidate character processes. In step S314, it is determined whether or not the content of the recognized supplementary character number counter i exceeds the number of recognition candidate characters set in the recognition candidate character number register. If the content of the recognition candidate character counter exceeds the number of recognition candidate characters (YES in step S314), since there are no more recognition candidate characters, the subsequent processing is stopped and the process proceeds to step S316. In step S316, all the character codes corresponding to the recognition candidate characters whose similarity exceeds the recognition-rejection determination threshold are output. On the other hand, if the content of the recognition candidate character counter i does not exceed the number of candidate characters (NO in step S314), the process proceeds to step S318.
[0029]
In step S318, the similarity of the i-th candidate is compared with the recognition-unrecognition threshold value for the recognition region including the recognition candidate character. If the similarity of the i-th candidate is smaller than the recognition-rejection determination threshold of the recognition area including the recognition-candidate character (NO in step S318), the candidate characters after the i-th candidate are regarded as unrecognizable, and the process proceeds to step S316. On the other hand, when the similarity of the i-th candidate is larger than the recognition-rejection determination threshold value of the recognition area including the recognition candidate character (YES in step S318), the process proceeds to step S320, the recognition candidate character number counter i is incremented, and step S314 is performed. Return to.
[0030]
It should be noted that the recognition candidate character number register and the recognition candidate character number counter are each realized in the
[0031]
Through the above processing, the rejection rate determined in each recognition area of the image signal has a tendency as shown in FIG. That is, when the rejection rate is high, the accuracy rate of characters determined to be recognizable is improved, but the absolute number is small. On the other hand, when the rejection rate is low, the number of characters determined to be recognizable is large, but the accuracy rate of characters also decreases. Therefore, in the present invention, each recognition of the image signal is performed based on the character recognition result of each recognition area of the
[0032]
FIG. 3 is a flowchart showing processing executed by the threshold control unit according to the embodiment of the present invention.
[0033]
In step S400, a recognition area pointer i indicating the recognition area to be processed in the image signal is initialized. Each recognition area in the image signal is numbered in order, and each recognition area is processed according to the value indicated by the recognition area pointer i. Further, the number of recognition areas in the image signal is stored in the recognition area number register. In
[0034]
On the other hand, if the number of unrecognizable characters in the recognition area corresponding to the i-th area is less than the first threshold value TH1 (NO in step S402), the process proceeds to step S404. In step S404, it is determined whether or not the number of unrecognizable characters is less than a second threshold value TH2 (<TH1). If the number of unrecognizable characters is less than the second threshold TH2 (YES in step S404), it is determined that the accuracy rate of the character recognition result has deteriorated, and the process proceeds to step 408. In
[0035]
On the other hand, if the unrecognizable characters of the recognition region corresponding to the i-region is the second threshold TH2 or higher (NO at Step S40 4), the current is set by the
[0036]
In step S410, it is determined whether or not the recognition-rejection determination threshold value has been set for all of the recognition regions in the image signal. That is, it is determined whether or not the value indicated by the recognition area pointer i is the same as the value stored in the recognition area number register. If the setting of the threshold for determination of unrecognition is completed (YES in step S410), the process ends. On the other hand, if the setting of the recognition failure determination threshold has not ended (NO in step S410), the process proceeds to step S412. In step S412, the value of the recognition area pointer i is incremented by 1, and the process returns to step S402.
[0037]
Note that the recognition area pointer and the recognition area number register are each realized in the
[0038]
As described above, according to the present invention, the
[0039]
In the above embodiment, a plurality of recognition candidate characters are output from the
[0040]
In the above embodiment, the communication system including the
[0041]
Note that the present invention can be applied to a system composed of a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), or an apparatus composed of a single device (for example, a copier, a facsimile machine, etc.). You may apply.
[0042]
Another object of the present invention is to supply a storage medium storing software program codes for implementing the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. Needless to say, this can also be achieved by reading and executing the program code stored in the.
[0043]
In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.
[0044]
As a storage medium for supplying the program code, for example, a floppy disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.
[0045]
Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) operating on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0046]
Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
[0047]
【The invention's effect】
As described above, according to the present invention, in a communication system that performs communication between a terminal that performs character recognition and a central controller, a communication system that can improve processing efficiency, a control method therefor, and a computer-readable memory are provided. it can.
[0048]
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing processing executed by a character recognition unit according to the embodiment of the present invention.
FIG. 3 is a flowchart illustrating processing executed by a threshold control unit according to the embodiment of this invention.
FIG. 4 is a diagram showing a relationship between a rejection rate and recognized character accuracy.
[Explanation of symbols]
Claims (5)
前記端末は、
原稿を画像データとして読み取る読取手段と、
前記読取手段で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識手段と、
前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識手段で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信手段と、
前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定手段と、を備え、
前記中央制御装置は、
前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信手段と、
前記文字認識結果受信手段で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御手段と、
前記閾値制御手段で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信手段と、
を備えることを特徴とする通信システム。A communication system that performs communication between a terminal and a central controller,
The terminal
Reading means for reading a document as image data;
The image data read by the reading unit is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area by using a recognition dictionary. The recognition candidate character and its similarity are calculated, and when the calculated similarity is equal to or less than the recognition-unrecognition determination threshold of the recognition area, it is output as a character recognition result indicating that the recognition is impossible. A character recognition unit that outputs the recognition candidate character as a character recognition result when the recognition area is larger than the recognition-recognition determination threshold;
A character recognition result transmission means for transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition means for indicating the location of the region to,
When receiving the unrecognized determination threshold for resetting any of the recognition areas from the central control unit, reset the unrecognizable determination threshold for the recognition area with the unrecognizable determination threshold for resetting Threshold reception setting means for
The central controller is
A character recognition result receiving means for receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
Based on said character recognition result character recognition of the received by the receiving means and the position information indicating the position of each recognition area each character image in said each recognition area results for each of the recognition region, the recognition area When it is determined that the number of characters determined to be unrecognizable in step S1 is equal to or greater than the first threshold, a value lower than the threshold for determining unrecognition of the recognition area used when obtaining the character recognition result in the recognition area When it is determined that the number of characters determined to be unrecognizable in the recognition area is smaller than the second threshold and less than the second threshold, the recognition is determined. Threshold control means for determining, as the unrecognition determination threshold for resetting the recognition area, a value higher than the recognition unrecognition determination threshold of the recognition area used when obtaining the character recognition result in the area;
Threshold transmission means for transmitting to the terminal a threshold for determination of unrecognition for resetting the recognition area determined by the threshold control means;
A communication system comprising:
ことを特徴とする請求項1に記載の通信システム。 The threshold control means, based on the character recognition result received by the character recognition result receiving means, that the number of characters determined to be unrecognizable within the recognition area is less than the first threshold and greater than or equal to the second threshold. 2. The communication system according to claim 1 , wherein when the determination is made, it is determined that the recognition threshold value used when obtaining the character recognition result in the recognition area is an appropriate value .
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
を備えることを特徴とする通信システムの制御方法。A control method of a communication system for performing communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A control method for a communication system, comprising:
ことを特徴とする請求項3に記載の通信システムの制御方法。 In the threshold control step, the number of characters determined to be unrecognizable in the recognition area based on the character recognition result received in the character recognition result receiving step is less than the first threshold and not less than the second threshold. 4. The communication system control method according to claim 3 , wherein if the determination is made, it is determined that the unrecognizable determination threshold value used when obtaining the character recognition result in the recognition area is an appropriate value. .
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果とを送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とを受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程で受信した前記各認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果とに基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ可読メモリ。 A computer-readable memory storing a program for causing a computer to execute control of a communication system that performs communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A computer-readable memory in which a program for causing a computer to execute is recorded.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35851997A JP3957848B2 (en) | 1997-12-25 | 1997-12-25 | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY |
US09/212,434 US6891972B2 (en) | 1997-12-19 | 1998-12-16 | Communication system and control method thereof, and computer-readable memory |
US11/081,504 US7440617B2 (en) | 1997-12-19 | 2005-03-17 | Communication system and control method thereof, and computer-readable memory |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35851997A JP3957848B2 (en) | 1997-12-25 | 1997-12-25 | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11191134A JPH11191134A (en) | 1999-07-13 |
JP3957848B2 true JP3957848B2 (en) | 2007-08-15 |
Family
ID=18459745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35851997A Expired - Fee Related JP3957848B2 (en) | 1997-12-19 | 1997-12-25 | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3957848B2 (en) |
-
1997
- 1997-12-25 JP JP35851997A patent/JP3957848B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11191134A (en) | 1999-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7440617B2 (en) | Communication system and control method thereof, and computer-readable memory | |
JP3957848B2 (en) | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY | |
JP3957846B2 (en) | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY | |
JP3957847B2 (en) | COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY | |
JPH02293989A (en) | Character recognizing device | |
JPH11184973A (en) | Communication system, control method for the same and computer readable memory | |
JPH07168913A (en) | Character recognition system | |
JPH11191140A (en) | Communication system, control method therefor and computer readable memory | |
JPH11213095A (en) | Character recognition device, its method and computer-readable memory | |
JPH11191141A (en) | Communication system, control method therefor and computer readable memory | |
JP3056950B2 (en) | Character recognition apparatus and method | |
JPH051512B2 (en) | ||
JP2856409B2 (en) | Character recognition apparatus and method | |
JPH09218741A (en) | Information controller and its control method | |
JP2713927B2 (en) | Character reader | |
JP2972443B2 (en) | Character recognition device | |
JP2001143020A (en) | Character recognition device, method and recording medium thereof | |
JP2002157550A (en) | Device and method for recognizing character and recording medium | |
JPS62281082A (en) | Character recognizing device | |
JP3045086B2 (en) | Optical character reading method and apparatus | |
JPH09305712A (en) | Method, device for recognizing character and storage medium storing program for character recognition | |
JPH08202830A (en) | Character recognition system | |
JP2002074269A (en) | Method for recognizing character | |
JPH07220028A (en) | Character recognition device | |
JPH05258097A (en) | Optical character reader |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041115 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20041115 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20041115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070509 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130518 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140518 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |