JPH06111078A - Character recognition system - Google Patents

Character recognition system

Info

Publication number
JPH06111078A
JPH06111078A JP4259502A JP25950292A JPH06111078A JP H06111078 A JPH06111078 A JP H06111078A JP 4259502 A JP4259502 A JP 4259502A JP 25950292 A JP25950292 A JP 25950292A JP H06111078 A JPH06111078 A JP H06111078A
Authority
JP
Japan
Prior art keywords
character
word
parameter
value
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4259502A
Other languages
Japanese (ja)
Inventor
Ryuichi Nakamura
隆一 中村
Atsuko Niimura
敦子 新村
Yukio Sakamoto
幸夫 坂本
Hirotaka Fuchizawa
博孝 渕沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP4259502A priority Critical patent/JPH06111078A/en
Publication of JPH06111078A publication Critical patent/JPH06111078A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To always keep a parameter to adjust the collation range of a word dictionary at a proper value, to improve a recognition rate, and to accelerate processing speed in a character recognition system. CONSTITUTION:The character recognition system which performs the collation of plural character candidates extracted from image data with a stored word, and estimates a correct answer character, and recognizes a character from the image data is provided with a parameter control part 6 which dynamically controls the setting of the parameter to adjust the collation range of the word dictionary used in a collation operation for the character candidate based on the correct answer rate of an estimated correct answer character and estimation processing time, thereby, a parameter value to adjust the collation range of the word dictionary can be always kept at the proper value.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、OCR(光学式文字読
み取り装置)など、イメージデータから、対象となる文
字の認識を行なう文字認識処理技術に係わり、特に、正
しい文字の認識率、および、認識処理速度を向上するの
に好適な文字認識後処理制御システムに関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition processing technique for recognizing a target character from image data such as an OCR (optical character reader), and more particularly to a correct character recognition rate and The present invention relates to a character recognition post-processing control system suitable for improving the recognition processing speed.

【0002】[0002]

【従来の技術】現在、OCR(光学式文字読み取り装
置)など、コンピュータを利用して、イメージデータか
ら、対象となる文字の認識を行なう文字認識システムが
開発されている。この文字認識システムは、認識の対象
となる文字の入力パターンと、予め登録してある参照パ
ターンとの照合により、入力パターンに類似する参照パ
ターンを抽出して、文字の認識を行なう。尚、このよう
な文字認識システムに関しては、例えば、社団法人 電
子情報通信学会編「電子情報通信ハンドブック」(19
88年、オーム社発行)の第1114頁から第1124
頁に記載されている。
2. Description of the Related Art At present, a character recognition system, such as an OCR (optical character reader), has been developed for recognizing a target character from image data using a computer. The character recognition system recognizes a character by extracting a reference pattern similar to the input pattern by collating an input pattern of a character to be recognized with a reference pattern registered in advance. Regarding such a character recognition system, for example, "Electronic Information and Communication Handbook" (19) edited by the Institute of Electronics, Information and Communication Engineers
1988, published by Ohmsha), pages 1114 to 1124.
Page.

【0003】一般に、照合動作は二度行なわれ、まず、
入力パターンに類似する幾つかの参照パターンを、文字
候補として抽出する文字候補の抽出時に行なわれ、さら
に、これらの文字候補から正解文字を推定する時に、単
語辞書に格納してある単語との照合が行なわれる。この
文字候補と単語辞書に格納してある単語との照合は、文
字認識後処理装置により行なわれる。
Generally, the collating operation is performed twice.
Some reference patterns that are similar to the input patterns are extracted as character candidates when extracting character candidates. Furthermore, when estimating correct characters from these character candidates, matching with the words stored in the word dictionary is performed. Is performed. The matching between the character candidates and the words stored in the word dictionary is performed by the character recognition post-processing device.

【0004】従来、この文字認識後処理装置では、単語
照合の照合範囲を調整するパラメータの適正値は、予め
想定した環境での評価測定により求めた値を、固定的に
設定していた。そのため、入力されたイメージデータの
品質や文字記入者の違いなどによる変化に対しては、こ
のパラメータ値が適正値に設定されていない状態で、単
語の照合が行なわることとなる。従来、このようなパラ
メータを適正値に保つためには、オペレータによる再設
定が必要である。そして、再設定した後も同様に、入力
イメージデータの変化に対応して、再々設定が必要にな
るため、オペレータに負担がかかってしまう。
Conventionally, in this character recognition post-processing device, the proper value of the parameter for adjusting the collation range of word collation has been fixedly set to a value obtained by evaluation measurement in an environment assumed in advance. Therefore, with respect to changes due to the quality of input image data and differences in character writers, word matching is performed with this parameter value not set to an appropriate value. Conventionally, in order to maintain such parameters at appropriate values, resetting by the operator is necessary. Similarly, even after resetting, it is necessary to reset again in response to changes in the input image data, which puts a burden on the operator.

【0005】[0005]

【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、単語辞書の照合範囲を調整する
パラメータを、オペレータの介在なしに適正値に保つこ
とができない点である。本発明の目的は、これら従来技
術の課題を解決し、単語辞書の照合範囲の調整に用いる
パラメータの設定を自動化し、オペレータの負荷を軽減
すると共に、正しい文字の認識率、および、認識処理速
度を向上させることを可能とする文字認識システムを提
供することである。
The problem to be solved is that in the conventional technique, the parameter for adjusting the collation range of the word dictionary cannot be maintained at an appropriate value without intervention of an operator. An object of the present invention is to solve these problems of the prior art, automate the setting of parameters used for adjusting the matching range of the word dictionary, reduce the load on the operator, and correct the recognition rate of characters and the recognition processing speed. It is to provide a character recognition system capable of improving.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するた
め、本発明の文字認識システムは、(1)イメージデー
タから文字を認識し、類似する複数の文字候補を抽出す
る文字候補抽出部と、この文字候補抽出部で抽出した各
々の文字候補と単語辞書中に格納してある単語との照合
を行ない、正解文字を推定する単語照合部とを具備し、
イメージデータからの文字認識を行なう文字認識システ
ムにおいて、単語照合部による文字候補と単語辞書中に
格納してある単語との照合に用いられる単語辞書の照合
範囲を調整するパラメータの値を、単語照合部の正解文
字の推定結果に基づき、動的に設定し、単語辞書の照合
範囲を調整するパラメータ値を、常時、適正値に保つパ
ラメータ制御部を設けることを特徴とする。また、
(2)上記(1)に記載の文字認識システムにおいて、
パラメータ制御部は、動的に設定するパラメータの値
を、単語照合部が推定した正解文字の正解率に基づき算
出する第一の設定値算出部を具備することを特徴とす
る。また、(3)上記(1)に記載の文字認識システム
において、パラメータ制御部は、動的に設定するパラメ
ータの値を、単語照合部の正解文字の推定処理時間に基
づき算出する第二の設定値算出部を具備することを特徴
とする。また、(4)上記(1)に記載の文字認識シス
テムにおいて、パラメータ制御部は、動的に設定するパ
ラメータの値を、単語照合部の正解文字の正解率と推定
処理時間に基づき算出する第三の設定値算出部を具備す
ることを特徴とする。
In order to achieve the above object, the character recognition system of the present invention comprises: (1) a character candidate extraction unit for recognizing a character from image data and extracting a plurality of similar character candidates. The character candidate extraction unit is provided with a word collation unit that collates each character candidate extracted by the character candidate extraction unit with a word stored in a word dictionary and estimates a correct character.
In a character recognition system that performs character recognition from image data, the value of a parameter that adjusts the matching range of the word dictionary used for matching the character candidates by the word matching unit with the words stored in the word dictionary is set to the word matching. The present invention is characterized in that a parameter control unit for dynamically setting the parameter value for dynamically adjusting the collation range of the word dictionary based on the estimation result of the correct answer character of the copy section and keeping the parameter value at an appropriate value is provided. Also,
(2) In the character recognition system according to (1) above,
The parameter control unit includes a first set value calculation unit that calculates a value of a parameter that is dynamically set based on the correct answer rate of the correct answer character estimated by the word matching unit. (3) In the character recognition system described in (1) above, the parameter control unit calculates the value of the parameter that is dynamically set based on the correct processing character estimation processing time of the word matching unit. It is characterized by comprising a value calculation unit. (4) In the character recognition system according to (1) above, the parameter control unit calculates the value of the parameter that is dynamically set based on the correct answer rate of the correct characters in the word matching unit and the estimated processing time. It is characterized by comprising three set value calculation units.

【0007】[0007]

【作用】本発明においては、単語辞書の照合範囲を調整
するパラメータの適正値が変化する度に、このパラメー
タ毎に、正しく認識できた文字の比率や、単語照合にか
かる処理時間を算出する。そして、それらが、システム
の利用者が望む値になるときのパラメータ適正値に自動
的に修正する。このように、単語辞書の照合範囲を調整
するパラメータを動的に再設定し、常時、パラメータを
適正値に保つことができ、正しく認識できた文字の比率
や単語照合にかかる処理時間の向上が可能となる。ま
た、オペレータによる再設定の必要がなくなり、オペレ
ータの負担を軽減できる。
In the present invention, each time the appropriate value of the parameter for adjusting the collation range of the word dictionary changes, the ratio of correctly recognized characters and the processing time required for word collation are calculated for each parameter. Then, they are automatically corrected to appropriate parameter values when the system user has desired values. In this way, the parameters for adjusting the matching range of the word dictionary can be dynamically re-set, and the parameters can always be kept at appropriate values, improving the ratio of correctly recognized characters and the processing time required for word matching. It will be possible. Further, it is not necessary for the operator to perform resetting, and the burden on the operator can be reduced.

【0008】[0008]

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の文字認識システムの本発明
に係わる構成の第1の実施例を示すブロック図である。
本図において、1は、イメージデータを読み取る帳票読
み取り装置、2は、帳票読み取り装置1で読み取ったイ
メージデータから目的の文字を切り出す前処理装置、3
は、前処理装置2で切り出した文字を認識し、類似する
文字候補を出力する文字認識装置、4は、文字認識装置
3で出力した文字候補から正解文字を抽出する文字認識
後処理装置、7は、ディスプレイおよびキーボード等を
具備し、オペレータが誤認識文字の修正を行なうオペレ
ータ操作装置である。文字認識後処理装置4は、文字認
識装置3が出力した文字候補と、単語辞書中に格納して
ある単語とを照合し、正解文字を推定する単語照合部5
と、本発明に係わり、単語照合5の照合動作に用いる単
語辞書の照合範囲を調整するパラメータの設定を動的に
制御するパラメータ制御部6とにより構成されている。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a first embodiment of a configuration relating to the present invention of a character recognition system of the present invention.
In the figure, 1 is a document reading device for reading image data, 2 is a pre-processing device for cutting out desired characters from the image data read by the document reading device 1, 3
Is a character recognition device that recognizes the characters cut out by the pre-processing device 2 and outputs similar character candidates, 4 is a character recognition post-processing device that extracts correct characters from the character candidates output by the character recognition device 3, 7 Is an operator operating device that includes a display, a keyboard, and the like, and allows an operator to correct erroneously recognized characters. The character recognition post-processing device 4 matches the character candidates output by the character recognition device 3 with the words stored in the word dictionary, and estimates the correct character.
According to the present invention, the parameter control unit 6 dynamically controls the setting of the parameter for adjusting the matching range of the word dictionary used for the matching operation of the word matching 5.

【0009】以下、本実施例の文字認識システムの動作
を説明する。帳票読み取り装置1で読み込んだイメージ
データを、前処理装置2で一文字毎に切り出し、文字認
識装置3で、一文字毎に認識し、認識候補文字列を出力
する。そして、文字認識後処理装置4は、単語照合部5
において、文字認識装置3で出力した認識候補文字列と
単語辞書を照合し、その結果を、オペレータ操作装置7
に渡す。このオペレータ操作装置7では、照合結果をデ
ィスプレイに表示し、オペレータは、この照合結果と帳
票とを比較して誤認識文字を修正する。この修正情報
は、パラメータ制御部6に渡される。
The operation of the character recognition system of this embodiment will be described below. The image data read by the form reading device 1 is cut out by the preprocessing device 2 for each character, and the character recognition device 3 recognizes each character and outputs a recognition candidate character string. Then, the character recognition post-processing device 4 uses the word matching unit 5
At this time, the recognition candidate character string output from the character recognition device 3 is collated with the word dictionary, and the result is compared with the operator operation device 7
Pass to. In the operator operating device 7, the collation result is displayed on the display, and the operator compares the collation result with the form to correct the erroneously recognized character. This correction information is passed to the parameter control unit 6.

【0010】パラメータ制御部6では、オペレータ操作
装置7からの誤認識文字修正情報を基に、単語照合部5
で使用するパラメータの制御を行なう。パラメータ制御
部6において、単語照合部5で設定されたパラメータ
は、単語照合部5に渡され、次の帳票で使用される。以
下、パラメータ制御部6の制御動作を、次の図2を用い
て説明する。
In the parameter control unit 6, the word collation unit 5 is based on the erroneously recognized character correction information from the operator operating device 7.
Control the parameters used in. In the parameter control unit 6, the parameters set by the word matching unit 5 are passed to the word matching unit 5 and used in the next form. The control operation of the parameter control unit 6 will be described below with reference to FIG.

【0011】図2は、図1におけるパラメータ制御部の
本発明に係わる処理動作の一実施例を示すフローチャー
トである。パラメータ制御部6では、オペレータ操作装
置7からの誤認識文字修正情報を基に、正しく認識でき
た文字の比率を計算する(ステップ61)。尚、この計
算は、読み込んだ帳票毎に行なう。前回、パラメータ値
を最適値に設定した際に正しく認識できた文字の比率を
基軸とし、この基軸から一定の値を加減した比率をしき
い値とし、正しく認識できた文字の比率が、しきい値を
超えたかどうかを判定する(ステップ62)。
FIG. 2 is a flow chart showing an embodiment of the processing operation according to the present invention of the parameter control unit in FIG. The parameter control unit 6 calculates the ratio of correctly recognized characters based on the erroneously recognized character correction information from the operator operating device 7 (step 61). This calculation is performed for each read form. The ratio of characters that were correctly recognized when the parameter value was set to the optimal value last time was used as the base axis, and the ratio of a certain value from this base axis was used as the threshold value. It is determined whether the value is exceeded (step 62).

【0012】判定結果がしきい値を超せば、単語照合部
5に対し、各パラメータ毎の照合結果を求め、この照合
結果から、各パラメータにおいて正しく認識できた文字
の比率を算出する(ステップ63)。その結果の比率が
最も高くなるパラメータ値を適正値として選定し、その
適正値を単語照合部5に渡す(ステップ64)。そし
て、パラメータが適正値のときの正しく認識できた文字
の比率を基軸として、次のしきい値設定を行なう(ステ
ップ65)。尚、ステップ62において、判定結果がし
きい値を越さない場合は、適正値は変化しないものとし
て、パラメータ値の設定は行なわない。
If the determination result exceeds the threshold value, the word collation unit 5 obtains the collation result for each parameter, and the ratio of the characters correctly recognized in each parameter is calculated from this collation result (step 63). The parameter value having the highest ratio of the result is selected as an appropriate value, and the appropriate value is passed to the word matching unit 5 (step 64). Then, the next threshold value is set with the ratio of correctly recognized characters when the parameter is an appropriate value as the base axis (step 65). In step 62, if the determination result does not exceed the threshold value, the appropriate value is not changed and the parameter value is not set.

【0013】図3は、図2におけるパラメータ制御部の
処理動作で用いるしきい値の概念の一例を示す説明図で
ある。本図において、31は、図1のオペレータ操作装
置7からの誤認識文字修正情報を基に算出される、正し
く認識できた文字の比率(0%〜100%)であり、3
2は、前回、パラメータ値を最適値に設定した際に正し
く認識できた文字の比率を示す基軸、33、34は、基
軸32から一定の値を加減した比率で、適正値の評価尺
度として用いるしきい値である。図1のパラメータ制御
部6は、正しく認識できた文字の比率が、図中の斜線部
分で示される領域、すなわち、しきい値33、34を超
えると、新たな適正値の選定、および、基軸32の設定
を行なう。
FIG. 3 is an explanatory diagram showing an example of the concept of the threshold value used in the processing operation of the parameter control unit in FIG. In the figure, 31 is the ratio (0% to 100%) of characters that can be correctly recognized, which is calculated based on the misrecognized character correction information from the operator operating device 7 in FIG.
2 is a base axis indicating the ratio of characters that were correctly recognized when the parameter value was set to the optimum value last time, and 33 and 34 are ratios obtained by adding or subtracting a certain value from the base shaft 32, which are used as evaluation scales for appropriate values. It is a threshold. The parameter control unit 6 of FIG. 1 selects a new appropriate value and the basic axis when the ratio of correctly recognized characters exceeds the shaded area in the drawing, that is, the threshold values 33 and 34. 32 is set.

【0014】図1における文字認識システムでは、パラ
メータ制御部6は、動的に設定するパラメータの値を、
図示していない本発明の第一の設定値算出部を用いて、
単語照合部5の正解文字の正解率に基づき算出している
が、パラメータの値は、次の図4で示すように、本発明
の第二の設定値算出部を用いて、単語照合部5の推定処
理時間に基づき算出することもできる。
In the character recognition system shown in FIG. 1, the parameter control unit 6 sets the value of the parameter dynamically set to
Using the first set value calculation unit of the present invention not shown,
The value is calculated based on the correct answer rate of the correct answer character of the word matching unit 5, but the value of the parameter is determined by using the second setting value calculating unit of the present invention as shown in FIG. It can also be calculated based on the estimated processing time.

【0015】図4は、本発明の文字認識システムの本発
明に係わる構成の第2の実施例を示すブロック図であ
る。本図において、1は、イメージデータを読み取る帳
票読み取り装置、2は、帳票読み取り装置1で読み取っ
たイメージデータから目的の文字を切り出す前処理装
置、3は、前処理装置2で切り出した文字を認識し、類
似する文字候補を出力する文字認識装置、4aは、文字
認識装置3で出力した文字候補から正解文字を抽出する
文字認識後処理装置、7は、ディスプレイおよびキーボ
ード等を具備し、オペレータが誤認識文字の修正を行な
うオペレータ操作装置である。
FIG. 4 is a block diagram showing a second embodiment of the structure relating to the present invention of the character recognition system of the present invention. In the figure, 1 is a form reading device that reads image data, 2 is a preprocessing device that cuts out a desired character from the image data read by the form reading device 1, and 3 is a character that is cut out by the preprocessing device 2 Then, the character recognition device 4a for outputting similar character candidates is a character recognition post-processing device for extracting correct characters from the character candidates output by the character recognition device 3, and 7 is provided with a display, a keyboard, etc. This is an operator operating device that corrects erroneously recognized characters.

【0016】文字認識後処理装置4aは、文字認識装置
3が出力した文字候補と、単語辞書中に格納してある単
語とを照合し、正解文字を推定する単語照合部5と、本
発明に係わり、単語照合5の照合動作に用いる単語辞書
の照合範囲を調整するパラメータの設定を動的に制御す
るパラメータ制御部6aとにより構成されている。ま
た、パラメータ制御部6aは、動的に設定するパラメー
タの値を、単語照合部5の推定処理時間に基づき算出す
る第二の設定値算出部8を具備している。
The character recognition post-processing device 4a collates the character candidates output by the character recognition device 3 with the words stored in the word dictionary, and in the present invention, a word collating unit 5 for estimating the correct character. Relatedly, it is configured by a parameter control unit 6a that dynamically controls the setting of the parameter that adjusts the matching range of the word dictionary used for the matching operation of the word matching 5. The parameter control unit 6a also includes a second setting value calculation unit 8 that calculates the value of the parameter that is dynamically set based on the estimated processing time of the word matching unit 5.

【0017】本第2の実施例の文字認識システムにおけ
る文字の認識動作は、図1を用いて説明した第1の実施
例の動作と同じであるが、本第2の実施例の文字認識シ
ステムでは、パラメータ制御部6aで設定する単語辞書
の照合範囲を調整するパラメータの値は、第二の設定値
算出部8により算出する。すなわち、パラメータ制御部
6aでは、第二の設定値算出部8により、読み込んだ帳
票毎に、単語照合部5の推定処理に要した時間を計算す
る。そして、前回、パラメータ値を最適値に設定した際
での推定処理時間を基軸とし、この基軸から一定の値を
加減してしきい値とし、このしきい値と今回の計算結果
との比較に基づき、パラメータの適正値の選定を行な
う。
The character recognition operation in the character recognition system of the second embodiment is the same as the operation of the first embodiment described with reference to FIG. 1, but the character recognition system of the second embodiment is the same. Then, the value of the parameter for adjusting the collation range of the word dictionary set by the parameter control unit 6a is calculated by the second setting value calculation unit 8. That is, in the parameter control unit 6a, the second set value calculation unit 8 calculates the time required for the estimation process of the word matching unit 5 for each of the read forms. Then, the estimated processing time when the parameter value was set to the optimal value last time was set as the base axis, and a certain value was added or subtracted from this base axis to set the threshold value, and this threshold value was compared with this calculation result. Based on this, an appropriate value for the parameter is selected.

【0018】以上、図1〜図4を用いて説明したよう
に、本第1、第2の実施例の文字認識システムでは、単
語辞書の照合範囲を調整するパラメータの設定を動的に
行ない、常時、適正値に設定することができる。このこ
とにより、入力された帳票条件、例えば、イメージデー
タの品質や、記入者の違いなどの変化に対応でき、正し
く認識できた文字の比率の低下や、後処理に要する処理
時間の増加を防ぐことができる。また、パラメータの設
定に係わるオペレータの負担を軽減することができる。
As described above with reference to FIGS. 1 to 4, in the character recognition systems of the first and second embodiments, the parameter for adjusting the collation range of the word dictionary is dynamically set. It can always be set to an appropriate value. This makes it possible to deal with changes in input form conditions, such as image data quality and differences in writers, preventing a decrease in the ratio of correctly recognized characters and an increase in the processing time required for post-processing. be able to. Further, it is possible to reduce the burden on the operator for setting the parameters.

【0019】尚、本発明は、図1〜図4を用いて説明し
た実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能である。例えば、本第
1、第2の実施例においては、適正値の評価尺度とし
て、第一の設定値算出部で求めた正しく認識できた文字
の比率と、第二の設定値算出部で求めた単語照合部の推
定処理時間を個別に用いたが、この処理速度と正しく認
識できた文字の比率と処理速度との組み合わせを、第三
の設定値算出部で求めて、適正値の評価尺度として用い
ても良い。
The present invention is not limited to the embodiment described with reference to FIGS. 1 to 4, and various modifications can be made without departing from the scope of the invention. For example, in the first and second examples, as the evaluation scale of the appropriate value, the ratio of the correctly recognized characters obtained by the first setting value calculation unit and the second setting value calculation unit were obtained. Although the estimated processing time of the word matching unit was used individually, a combination of this processing speed, the ratio of correctly recognized characters, and the processing speed was obtained by the third set value calculation unit, and used as an evaluation scale of an appropriate value. You may use.

【0020】[0020]

【発明の効果】本発明によれば、文字認識システムにお
いて、単語辞書の照合範囲を調整するパラメータを、オ
ペレータの介在なしに常時適正値に保つことができ、オ
ペレータの負荷を軽減すると共に、正しい文字の認識
率、および、認識処理速度を向上させることが可能であ
る。
According to the present invention, in the character recognition system, the parameter for adjusting the collation range of the word dictionary can be kept at an appropriate value at all times without the intervention of the operator, and the operator's load is reduced and the correct value is obtained. It is possible to improve the character recognition rate and the recognition processing speed.

【0021】[0021]

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文字認識システムの本発明に係わる構
成の第1の実施例を示すブロック図である。
FIG. 1 is a block diagram showing a first embodiment of a configuration according to the present invention of a character recognition system of the present invention.

【図2】図1におけるパラメータ制御部の本発明に係わ
る処理動作の一実施例を示すフローチャートである。
FIG. 2 is a flowchart showing an embodiment of the processing operation of the parameter control unit in FIG. 1 according to the present invention.

【図3】図2におけるパラメータ制御部の処理動作で用
いるしきい値の概念の一例を示す説明図である。
FIG. 3 is an explanatory diagram showing an example of the concept of threshold values used in the processing operation of the parameter control unit in FIG.

【図4】本発明の文字認識システムの本発明に係わる構
成の第2の実施例を示すブロック図である。
FIG. 4 is a block diagram showing a second embodiment of the configuration related to the present invention of the character recognition system of the present invention.

【符号の説明】[Explanation of symbols]

1 帳票読み取り装置 2 前処理装置 3 文字認識装置 4 文字認識後処理装置 5 単語照合部 6、6a パラメータ制御部 7 オペレータ操作装置 8 第二の設定値算出部 31 正しく認識できた文字の比率 32 基軸 33、34 しきい値 1 form reading device 2 pre-processing device 3 character recognition device 4 character recognition post-processing device 5 word collation unit 6, 6a parameter control unit 7 operator operation device 8 second set value calculation unit 31 ratio of correctly recognized characters 32 base axis 33, 34 threshold

───────────────────────────────────────────────────── フロントページの続き (72)発明者 渕沢 博孝 東京都港区虎ノ門1丁目26番5号 エヌ・ ティ・ティ・データ通信株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Hirotaka Fuchizawa 1-26-5 Toranomon Minato-ku, Tokyo NTT Data Communications Co., Ltd.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 イメージデータから文字を認識し、類似
する複数の文字候補を抽出する文字候補抽出手段と、該
文字候補抽出手段で抽出した各々の文字候補と単語辞書
中に格納してある単語との照合を行ない、正解文字を推
定する単語照合手段とを具備し、イメージデータからの
文字認識を行なう文字認識システムにおいて、上記単語
照合手段による上記文字候補と単語辞書中に格納してあ
る単語との照合に用いられる上記単語辞書の照合範囲を
調整するパラメータの値を、上記単語照合手段の上記正
解文字の推定結果に基づき、動的に設定し、上記単語辞
書の照合範囲を調整するパラメータ値を、常時、適正値
に保つパラメータ制御手段を設けることを特徴とする文
字認識システム。
1. A character candidate extracting means for recognizing a character from image data and extracting a plurality of similar character candidates, and each character candidate extracted by the character candidate extracting means and a word stored in a word dictionary. In a character recognition system that includes a word collating unit that collates with the word and estimates a correct character, and performs character recognition from image data, the word candidate stored by the word collating unit and the word stored in the word dictionary. The value of the parameter for adjusting the matching range of the word dictionary used for matching with, based on the estimation result of the correct character of the word matching means, dynamically set, the parameter for adjusting the matching range of the word dictionary A character recognition system characterized by comprising a parameter control means for keeping the value at an appropriate value at all times.
【請求項2】 請求項1に記載の文字認識システムにお
いて、上記パラメータ制御手段は、上記動的に設定する
パラメータの値を、上記単語照合手段が推定した上記正
解文字の正解率に基づき算出する第一の設定値算出手段
を具備することを特徴とする文字認識システム。
2. The character recognition system according to claim 1, wherein the parameter control means calculates the value of the dynamically set parameter based on the correct answer rate of the correct character estimated by the word matching means. A character recognition system comprising a first setting value calculation means.
【請求項3】 請求項1に記載の文字認識システムにお
いて、上記パラメータ制御手段は、上記動的に設定する
パラメータの値を、上記単語照合手段の上記正解文字の
推定処理時間に基づき算出する第二の設定値算出手段を
具備することを特徴とする文字認識システム。
3. The character recognition system according to claim 1, wherein the parameter control means calculates a value of the parameter dynamically set based on an estimated processing time of the correct character of the word matching means. A character recognition system comprising a second set value calculating means.
【請求項4】 請求項1に記載の文字認識システムにお
いて、上記パラメータ制御手段は、上記動的に設定する
パラメータの値を、上記単語照合手段の上記正解文字の
正解率と推定処理時間に基づき算出する第三の設定値算
出手段を具備することを特徴とする文字認識システム。
4. The character recognition system according to claim 1, wherein the parameter control means sets the value of the parameter dynamically set based on the correct answer rate of the correct answer character and the estimation processing time of the word matching means. A character recognition system comprising a third setting value calculating means for calculating.
JP4259502A 1992-09-29 1992-09-29 Character recognition system Pending JPH06111078A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4259502A JPH06111078A (en) 1992-09-29 1992-09-29 Character recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4259502A JPH06111078A (en) 1992-09-29 1992-09-29 Character recognition system

Publications (1)

Publication Number Publication Date
JPH06111078A true JPH06111078A (en) 1994-04-22

Family

ID=17334993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4259502A Pending JPH06111078A (en) 1992-09-29 1992-09-29 Character recognition system

Country Status (1)

Country Link
JP (1) JPH06111078A (en)

Similar Documents

Publication Publication Date Title
JP2991779B2 (en) Character recognition method and device
JPH0789363B2 (en) Character recognition device
JPH06111078A (en) Character recognition system
JP2002056356A (en) Character recognizing device, character recognizing method, and recording medium
JP4049289B2 (en) Character recognition method, character recognition apparatus and recording medium
JPH06274687A (en) Character recognition parameter control system
JP3267038B2 (en) Character recognition device
JP2746345B2 (en) Post-processing method for character recognition
JP3957848B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JP3957847B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JP2982244B2 (en) Character recognition post-processing method
JPS61251982A (en) Optical character reader
JP2974396B2 (en) Image processing method and apparatus
JPH05189604A (en) Optical character reader
JP3595081B2 (en) Character recognition method
JPH076203A (en) Character recognition device
JP3226355B2 (en) Recognition result evaluation method
JPH04304586A (en) Device for recognizing character
JPH03150690A (en) Character recognizing device
JP2867382B2 (en) Font determination method in character recognition device
JPH11184973A (en) Communication system, control method for the same and computer readable memory
JPH076201A (en) Character recognition parameter control method
JPH11184972A (en) Communication system, control method for the same and computer readable memory
JPH06124281A (en) Line feed processing method for japanecse processor
JPH03217993A (en) Character size recognizer