JPH1139430A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH1139430A
JPH1139430A JP9195444A JP19544497A JPH1139430A JP H1139430 A JPH1139430 A JP H1139430A JP 9195444 A JP9195444 A JP 9195444A JP 19544497 A JP19544497 A JP 19544497A JP H1139430 A JPH1139430 A JP H1139430A
Authority
JP
Japan
Prior art keywords
recognition
category
result
thrv
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9195444A
Other languages
Japanese (ja)
Inventor
Gakuhei Riyuu
学平 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9195444A priority Critical patent/JPH1139430A/en
Publication of JPH1139430A publication Critical patent/JPH1139430A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve an integrating method for recognition results through plural character recognizing means and to improve recognition precision. SOLUTION: A recognition controlling part 105 selects one or plural recognizing parts 103 and operates them in accordance with the mode that is designated by a user inputting part 109. A selected recognizing part outputs a distance value to a template of a dictionary 104 together with the recognition result of an input character image that is processed by a preprocessing part 102. When two recognizing parts are selected, an integrating part 106 integrates recognition results of the two recognizing parts and decides a final recognition result and at the time of the integration, it utilizes a distance value which is related to the quality of the input character image and is outputted from the recognizing part.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明が属する技術分野】本発明は、文字認識技術に関
する。
[0001] The present invention relates to a character recognition technology.

【0002】[0002]

【従来の技術】様々な文字認識手法があるが、単一の手
法だけでは十分な認識精度を達成できない場合がある。
さらに高い認識精度を達成する方法として、認識手法の
異なる2つ又はそれ以上の認識手段を組み合わせる方法
がある。
2. Description of the Related Art There are various character recognition methods, but there are cases where a single method cannot achieve sufficient recognition accuracy.
As a method of achieving higher recognition accuracy, there is a method of combining two or more recognition means having different recognition methods.

【0003】そのような例がH.Yamagataほか,”A
Handwritten CharacterRecognition of Multiple
Classifiers”,IEICE TRANS,INF.& S
YST.,Vol.E79−D,No.5,MAY 1996
に述べられている。これは、2つの認識手段M1,M2
の認識結果を統合して最終的な認識結果を出力するが、
その際に図12に示すような決定マトリックスを用い
る。例えば、M1の認識結果が「6」、M2の認識結果
が「1」の場合、「6」の行と「1」の列の交差位置に
記入されている「6」が統合結果として出力される。ま
た、M1の認識結果が「2」、M2の認識結果が「3」
の場合、「?」(認識拒否)が統合結果として出力され
る。
[0003] One such example is H. Yamagata et al., "A.
Handwritten CharacterRecognition of Multiple
Classifiers ", IEICE TRANS, INF. & S
YST., Vol. E79-D, No. 5, MAY 1996
It is described in. This means that the two recognition means M1 and M2
Output the final recognition result by integrating the recognition results of
At that time, a decision matrix as shown in FIG. 12 is used. For example, when the recognition result of M1 is “6” and the recognition result of M2 is “1”, “6” written at the intersection of the row of “6” and the column of “1” is output as the integration result. You. Further, the recognition result of M1 is “2”, and the recognition result of M2 is “3”.
In the case of, “?” (Recognition rejection) is output as the integration result.

【0004】[0004]

【発明が解決しようとする課題】上記統合方法にあって
は、認識手段M1,M2の認識結果C1,C2である場
合、その統合結果はC1,C2,認識拒否の中のどれか
1つに決められるが、この統合結果は予め実験に基づき
作成された決定マトリックスに依拠して一意的に決まる
ため、認識される文字イメージの質によっては期待する
ような認識精度の向上を達成できない場合がある。
In the above integration method, when the recognition results of the recognition means M1 and M2 are C1 and C2, the integration result is one of C1, C2 and rejection of recognition. However, since the integration result is uniquely determined based on a decision matrix created based on experiments in advance, the expected improvement in recognition accuracy may not be achieved depending on the quality of the recognized character image. .

【0005】本発明の主たる目的は、かかる点を考慮に
入れて認識結果の統合を行うことにより、認識精度の一
層の向上を達成することである。本発明の他の目的は、
文字認識の目的や認識対象の文字イメージの品質などに
応じて動作環境を選択できる文字認識装置を提供するこ
とにある。
A main object of the present invention is to achieve a further improvement in recognition accuracy by integrating recognition results in consideration of such points. Another object of the present invention is to
An object of the present invention is to provide a character recognition device capable of selecting an operation environment in accordance with the purpose of character recognition and the quality of a character image to be recognized.

【0006】[0006]

【課題を解決するための手段】請求項1記載の発明によ
れば、文字認識装置は、文字イメージのデータを入力す
る手段と、入力された文字イメージと辞書のテンプレー
ト又は標準パターンとの整合をとり、認識結果とともに
テンプレートとの距離値を出力する複数の認識手段と、
該複数の認識手段より少なくとも1つの認識手段を選択
して動作させる手段と、該認識手段が複数選択されて動
作させられる場合に、該選択された認識手段より出力さ
れた認識結果を統合して最終的な認識結果を決定する統
合手段とを具備し、該統合手段は、該選択された複数の
認識手段より出力された距離値(これは入力文字イメー
ジの質を反映する)を、該選択された複数の認識手段よ
り出力された認識結果の統合に利用する構成とされる。
According to the first aspect of the present invention, there is provided a character recognition apparatus for inputting character image data, and for matching a character image input with a dictionary template or standard pattern. A plurality of recognition means for outputting a distance value from the template together with the recognition result;
Means for selecting and operating at least one recognizing means from the plurality of recognizing means, and integrating the recognition results output from the selected recognizing means when the plurality of recognizing means are selected and operated. Integrating means for determining a final recognition result, wherein the integrating means uses the distance values (which reflect the quality of the input character image) output from the selected plurality of recognition means in the selection. Used for integrating the recognition results output from the plurality of recognized means.

【0007】請求項2記載の発明によれば、該統合手段
は、選択された2つの認識手段中の一方の認識手段の認
識結果が認識拒否で、他方の認識手段の認識結果がある
カテゴリCである場合、該他方の認識手段のカテゴリC
に関して予め用意された閾値thに比べ該他方の認識手
段より出力された距離値が小さいときに、カテゴリCを
最終的な認識結果とし、そうでないときに認識拒否を最
終的な認識結果とする構成とされる。
According to the second aspect of the present invention, the integrating means includes a category C in which the recognition result of one of the two selected recognition means is rejection, and the recognition result of the other recognition means is in the category C. , The category C of the other recognition means
When the distance value output from the other recognition means is smaller than the threshold value th prepared in advance, the category C is regarded as the final recognition result, and otherwise, the recognition rejection is regarded as the final recognition result. It is said.

【0008】請求項3記載の発明によれば、該統合手段
はまた、選択された2つの認識手段中の一方の認識手段
の認識結果があるカテゴリCj、他方の認識手段の認識
結果があるカテゴリCkである場合、該一方の認識手段
のカテゴリCjに関して予め用意された認識精度評価値
V(j)が該他方の認識手段のカテゴリCkに関して予め
用意された認識精度評価値V(k)より小さいときには、
該一方の認識手段のカテゴリCjに関して予め用意され
た閾値thrv(j),trej(j)と該一方の認識手段より出力
された距離値d(j)との大小関係が、d(j)<thrv(j)
ならばカテゴリCjを、thrv(j)≦d(j)<trej(j)な
らばカテゴリCkを、d(j)≧trej(j)ならば認識拒否
をそれぞれ最終的な認識結果とし、該認識精度評価値V
(j)が該認識精度評価値V(k)以上のときには、該他方
の認識手段のカテゴリCkに関して予め用意された閾値t
hrv(k),trej(k)と該他方の認識手段より出力された
距離値d(k)との大小関係が、d(k)<thrv(k)ならば
カテゴリCkを、thrv(k)≦d(k)<trej(k)ならばカ
テゴリCjを、d(k)≧trej(k)ならば認識拒否をそれ
ぞれ最終的な認識結果とする構成とされる。
According to the third aspect of the present invention, the integrating means further includes a category Cj having a recognition result of one of the two selected recognition means and a category having a recognition result of the other recognition means. In the case of Ck, the recognition accuracy evaluation value V (j) prepared for the category Cj of the one recognition means is smaller than the recognition accuracy evaluation value V (k) prepared for the category Ck of the other recognition means. Sometimes
The magnitude relation between threshold values thrv (j), trej (j) prepared in advance for the category Cj of the one recognition means and the distance value d (j) output from the one recognition means is d (j) < thrv (j)
If thr (j) ≦ d (j) <trej (j), then category Ck, if d (j) ≧ trej (j), rejection of recognition is the final recognition result. Accuracy evaluation value V
When (j) is equal to or greater than the recognition accuracy evaluation value V (k), a threshold value t prepared in advance for the category Ck of the other recognition means.
If the magnitude relationship between hrv (k), trej (k) and the distance value d (k) output from the other recognition means is d (k) <thrv (k), the category Ck is determined, and the thrv (k) is determined. If ≦ d (k) <trej (k), the category Cj is the final recognition result, and if d (k) ≧ trej (k), the rejection is the final recognition result.

【0009】また、請求項4記載の発明によれば、請求
項1記載の発明による文字認識装置において、ユーザが
モードを指定するための手段が設けられ、該認識手段を
選択する手段はユーザによるモード指定に従って、認識
速度を優先して予め選定された1つの認識手段、認識速
度を優先して予め選定された2つの認識手段、認識精度
を優先して予め選定された1つの認識手段、又は認識精
度を優先して予め選定された複数の認識手段を選択して
動作させる構成とされる。
According to a fourth aspect of the present invention, in the character recognition device according to the first aspect of the present invention, a means for a user to specify a mode is provided, and the means for selecting the recognition means is provided by the user. In accordance with the mode designation, one recognition means pre-selected with priority on recognition speed, two recognition means pre-selected with priority on recognition speed, one recognition means pre-selected with priority on recognition accuracy, or The configuration is such that a plurality of recognition means selected in advance are selected and operated with priority given to recognition accuracy.

【0010】請求項5記載の発明によれば、請求項2又
は3記載の発明による文字認識装置において、ユーザが
モードを指定するための手段が設けられ、該認識手段を
選択する手段は、ユーザによるモード指定に従って、認
識速度を優先して予め選定された2つの認識手段、又
は、認識精度を優先して予め選定された2つの認識手段
を選択して動作させる構成とされる。
According to a fifth aspect of the present invention, in the character recognition apparatus according to the second or third aspect, a means for designating a mode by a user is provided, and the means for selecting the recognition means is provided by a user. In accordance with the mode designation by, the two recognition units selected in advance with priority on the recognition speed or the two recognition units selected in advance with priority on the recognition accuracy are selected and operated.

【0011】[0011]

【発明の実施の形態】図1は、本発明の一実施例による
文字認識装置の機能ブロック図である。ここに示す文字
認識装置は、認識すべき文書等のイメージをイメージス
キャナ等で読み取って入力するイメージ入力部101、
イメージ入力部101による入力イメージより文字イメ
ージを切り出して正規化するといった前処理を行う前処
理部102、前処理部102により処理後の個々の文字
イメージに対し異なった処理方法で文字認識を行う複数
の認識部(M1,M2,...,Mn)103を含む。各
認識部103は、それぞれの認識処理のための辞書(D
1,D2,...,Dn)104を持つ。ただし、これら
辞書104は必ずしも各認識部103毎に独立している
必要はない。各認識部103は、入力した文字イメージ
をあるカテゴリの文字であると認識した場合には、その
文字コードとともに、該カテゴリのテンプレートと入力
文字イメージとの距離値を出力し、また、認識結果が
「認識拒否」である場合には認識拒否のコードを出力す
る。
FIG. 1 is a functional block diagram of a character recognition device according to one embodiment of the present invention. The character recognition device shown here reads an image of a document or the like to be recognized by an image scanner or the like and inputs the image.
A pre-processing unit 102 that performs pre-processing such as extracting and normalizing a character image from an input image input by the image input unit 101, and a plurality of units that perform character recognition on the individual character images processed by the pre-processing unit 102 using different processing methods. , Mn, M2,..., Mn 103. Each recognizing unit 103 stores a dictionary (D
1, D2,. . . , Dn) 104. However, these dictionaries 104 do not necessarily need to be independent for each recognition unit 103. When each of the recognition units 103 recognizes the input character image as a character of a certain category, the recognition unit 103 outputs a distance value between the template of the category and the input character image together with the character code. If it is "recognition rejection", a code for rejection of recognition is output.

【0012】この文字認識装置は、2つの認識部による
認識結果を統合して最終的な一つの認識結果を出力する
統合部106、ユーザ入力部109からのモード指定に
従って、複数の認識部103より1つ又は2つの認識部
を選択するとともに統合部106による統合処理を制御
するための認識制御部105と、統合部106により得
られた最終的な認識結果を出力装置や記憶装置などへ出
力する出力部108を含む。制御部105は、認識部1
03の選択及び統合部106による統合処理の制御のた
めの情報を格納した制御情報テーブル107を持つ。
The character recognition device integrates the recognition results of the two recognition units and outputs a final one recognition result. A recognition control unit 105 for selecting one or two recognition units and controlling integration processing by the integration unit 106, and outputs a final recognition result obtained by the integration unit 106 to an output device, a storage device, or the like. An output unit 108 is included. The control unit 105 controls the recognition unit 1
It has a control information table 107 storing information for selection of the 03 and control of the integration processing by the integration unit 106.

【0013】ユーザは、ユーザ入力部109より、速度
優先(1)、速度優先(2)、精度優先(1)、精度優
先(2)の4種類のモードを指定することができ、各モ
ードに対応した制御情報が制御情報テーブル107に格
納されている。制御情報テーブル107の内容の一例を
図2に模式的に示す。図2に示す例においては、制御情
報テーブル107は各モードに対応したエントリーを持
ち、各モードのエントリーは、認識手段(1)、認識手
段(2)及び統合フラグの各フィールドからなる。○印
が記入されたフィールドは指定がある事もしくは有効を
意味し、−印が記入されたフィールドは無指定もしくは
無効を意味する。
The user can designate four modes of speed priority (1), speed priority (2), accuracy priority (1), and accuracy priority (2) from the user input unit 109. The corresponding control information is stored in the control information table 107. An example of the contents of the control information table 107 is schematically shown in FIG. In the example shown in FIG. 2, the control information table 107 has an entry corresponding to each mode, and the entry of each mode includes fields of a recognition unit (1), a recognition unit (2), and an integration flag. Fields marked with “○” mean designation or validity, and fields marked with “−” mean no designation or invalidation.

【0014】速度優先(1)又は精度優先(1)のモー
ドがユーザにより指定された場合、認識制御部105
は、制御情報テーブル107の当該各モードのエントリ
ーの認識手段(1)のフィールドに指定された1つの認
識部103を選択し、それのみを動作させる。認識制御
部105はまた、当該各モードのエントリーの統合フラ
グのフィールドは無効であるので、統合部106に対
し、選択した認識部103による認識結果をそのまま出
力させるように制御する。したがって、選択された1つ
の認識部103が、前処理部102より入力された文字
イメージと辞書104中の各カテゴリのテンプレート
(又は標準パターン)との距離を計算し、距離が最小と
なったカテゴリの文字コードと、その距離値を出力する
が、その最小の距離がある閾値を超える場合には、認識
拒否のコードを出力する。この文字コード又は認識拒否
のコードは、そのまま統合部106の出力となり出力部
108より出力される。
When the mode of speed priority (1) or accuracy priority (1) is designated by the user, the recognition control unit 105
Selects one recognition unit 103 specified in the field of the recognition means (1) of the entry of each mode in the control information table 107, and operates only the recognition unit 103. The recognition control unit 105 also controls the integration unit 106 to output the recognition result by the selected recognition unit 103 as it is, because the field of the integration flag of the entry of each mode is invalid. Therefore, one selected recognition unit 103 calculates the distance between the character image input from the preprocessing unit 102 and the template (or standard pattern) of each category in the dictionary 104, and determines the category having the minimum distance. Is output, and if the minimum distance exceeds a certain threshold, a code of recognition rejection is output. This character code or the code of recognition rejection becomes the output of the integration unit 106 as it is, and is output from the output unit 108.

【0015】速度優先(2)又は精度優先(2)のモー
ドがユーザにより指定された場合、認識制御部105
は、制御テーブル107の当該各モードのエントリーの
認識手段(1)及び認識手段(2)のフィールドに指定
された2つの認識部103を選択し、その2つだけを動
作させる。認識制御部105はまた、統合部106に対
し、当該各モードの統合フラグの統合フラグのフィール
ドが有効であるので、当該2つの認識部103の認識結
果の統合を指示する。なお、選択された2つの認識部1
03は、同時並行的に動作させるのが認識速度の面では
有利であるが、一方を先に動作させ、その終了をまって
他方を動作させるようにしてもよい。
When the mode of speed priority (2) or accuracy priority (2) is designated by the user, the recognition control unit 105
Selects two recognizing units 103 specified in the fields of the recognizing means (1) and the recognizing means (2) of the entry of each mode in the control table 107 and operates only two of them. The recognition control unit 105 also instructs the integration unit 106 to integrate the recognition results of the two recognition units 103 because the integration flag field of the integration flag of each mode is valid. The selected two recognition units 1
In 03, it is advantageous in terms of the recognition speed to operate simultaneously and in parallel, but it is also possible to operate one first and stop the other before operating the other.

【0016】速度優先(2)又は精度優先(2)のモー
ドの場合に選択される2つの認識部103(仮にMj,
Mkと表す)のための認識辞書104(Dj,Dk)につ
いては、それら認識部の認識結果の統合の際に必要とな
る認識精度評価値V、閾値th,thrv,trejがカテゴリ毎
に格納されている。認識辞書Dj,Dkの内容を模式的に
図3に示す。このV,th,thrv,trejについては後に説
明する。また、これらの値は、辞書とは別のテーブルな
どとして用意されてもよい。
Two recognizing units 103 (for example, Mj and Mj) selected in the mode of speed priority (2) or accuracy priority (2).
For the recognition dictionary 104 (Dj, Dk) for Mk), the recognition accuracy evaluation value V and the threshold values th, thrv, and trej required for integrating the recognition results of the recognition units are stored for each category. ing. FIG. 3 schematically shows the contents of the recognition dictionaries Dj and Dk. V, th, thrv, and trej will be described later. Further, these values may be prepared as a table or the like separate from the dictionary.

【0017】次に、速度優先(2)又は精度優先(2)
のモードの場合の統合部106による統合処理につい
て、図4のフローチャートを参照して説明する。
Next, speed priority (2) or accuracy priority (2)
The integration process performed by the integration unit 106 in the mode described above will be described with reference to the flowchart in FIG.

【0018】まず2つの認識部Mj,Mkの認識結果が同
一であるか調べる(ステップ201)。認識結果が同一
ならば(両方が同一カテゴリであるか認識拒否の場
合)、そのカテゴリの文字コード又は認識拒否のコード
を最終的な認識結果として出力する(ステップ20
2)。
First, it is checked whether the recognition results of the two recognition units Mj and Mk are the same (step 201). If the recognition results are the same (both are in the same category or the recognition is rejected), the character code of that category or the code of the recognition rejection is output as the final recognition result (step 20).
2).

【0019】2つの認識部Mj,Mkの認識結果が同一で
ない場合には、どちらか一方の認識部の認識結果が認識
拒否であるか調べる(ステップ203)。一方の認識
部、例えばMjの認識結果が認識拒否ならば、他方の認
識部Mkの辞書Dkより、認識部Mkの認識結果であるカ
テゴリ(Cとする)に対応した閾値thを読み込む(ステ
ップ204)。そして、認識部Mkより出力された距離
(辞書Dk内のカテゴリCのテンプレートと入力文字イ
メージとの距離)が閾値thより小さいか判定する(ステ
ップ205)。距離<thならば、認識部Mkの認識結果
であるカテゴリCの文字コードを最終的な認識結果とし
て出力する(ステップ206)。距離≧thならば、認識
拒否のコードを最終的な認識結果として出力する(ステ
ップ207)。
If the recognition results of the two recognition units Mj and Mk are not the same, it is checked whether the recognition result of one of the recognition units is rejected (step 203). If the recognition result of one of the recognition units, for example, Mj is rejected, the threshold th corresponding to the category (C) which is the recognition result of the recognition unit Mk is read from the dictionary Dk of the other recognition unit Mk (step 204). ). Then, it is determined whether the distance output from the recognition unit Mk (the distance between the template of the category C in the dictionary Dk and the input character image) is smaller than the threshold th (step 205). If the distance <th, the character code of the category C, which is the recognition result of the recognition unit Mk, is output as the final recognition result (step 206). If the distance ≧ th, the recognition rejection code is output as the final recognition result (step 207).

【0020】他方、認識部Mj.Mkの認識結果が認識拒
否ではない場合(ここでは認識部MjでカテゴリCj,認
識部MkでカテゴリCkと認識されたとする)、ステップ
210以下の処理に進む。まず、辞書Djよりカテゴリ
Cjに対応した認識精度評価値V(j)と閾値thrv(j),t
rej(j)を、辞書DjよりカテゴリCkに対応した認識精
度評価値V(k)と閾値thrv(k),trej(k)を読み込む
(ステップ210)。そして、認識精度評価値V(j),
V(k)の大小比較判定を行う(ステップ211)。
On the other hand, the recognition units Mj. If the recognition result of Mk is not rejection of recognition (here, it is assumed that the recognition unit Mj has recognized the category Cj and the recognition unit Mk has recognized the category Ck), the process proceeds to step 210 and subsequent steps. First, the recognition accuracy evaluation value V (j) corresponding to the category Cj and the threshold values thrv (j), t
For rej (j), the recognition accuracy evaluation value V (k) corresponding to the category Ck and the threshold values thrv (k) and trej (k) are read from the dictionary Dj (step 210). Then, the recognition accuracy evaluation value V (j),
The magnitude comparison of V (k) is performed (step 211).

【0021】V(j)<V(k)の場合、認識部Mjの認識
結果をベースにして最終的な認識結果を決定する。すな
わち、認識部Mjから出力された距離と閾値thrv(j),t
rej(j)との大小比較判定を行う(ステップ213)。
この比較判定の結果、距離<thrv(j)ならばカテゴリC
jの文字コードを最終的な認識結果として出力し(ステ
ップ214)、trej(j)>距離≧thrv(j)ならばカテゴ
リCkの文字コードを最終的な認識結果として出力し
(ステップ215)、距離≧trej(j)ならば認識拒否の
コードを最終的な認識結果として出力する(ステップ2
16)。
When V (j) <V (k), the final recognition result is determined based on the recognition result of the recognition unit Mj. That is, the distance output from the recognition unit Mj and the threshold value thrv (j), t
A magnitude comparison with rej (j) is determined (step 213).
As a result of the comparison, if distance <thrv (j), category C
The character code of j is output as the final recognition result (step 214). If trej (j)> distance ≧ thrv (j), the character code of category Ck is output as the final recognition result (step 215). If distance ≧ trej (j), a code of rejection of recognition is output as a final recognition result (step 2).
16).

【0022】一方、ステップ211の判定結果がV(j)
≧V(k)の場合、認識部Mkの認識結果をベースにして
最終的な認識結果を決定する。すなわち、認識部Mkか
ら出力された距離と閾値thrv(k),trej(k)との大小比
較判定を行う(ステップ223)。この比較判定の結
果、距離<thrv(k)ならばカテゴリCkの文字コードを
最終的な認識結果として出力し(ステップ224)、tr
ej(k)>距離≧thrv(k)ならばカテゴリCjの文字コー
ドを最終的な認識結果として出力し(ステップ22
5)、距離≧trej(k)ならば認識拒否のコードを最終的
な認識結果として出力する(ステップ226)。
On the other hand, the result of the determination in step 211 is V (j)
If ≧ V (k), the final recognition result is determined based on the recognition result of the recognition unit Mk. That is, a magnitude comparison between the distance output from the recognition unit Mk and the thresholds thrv (k) and trej (k) is determined (step 223). If the result of this comparison is that distance <thrv (k), the character code of category Ck is output as the final recognition result (step 224), and tr
If ej (k)> distance ≧ thrv (k), the character code of category Cj is output as the final recognition result (step 22).
5) If distance ≧ trej (k), the recognition rejection code is output as the final recognition result (step 226).

【0023】以上に説明した文字認識装置は、例えば図
5に簡略化して示すような、CPU300、メモリ30
1、ハードディスク装置302、プリンタ303、キー
ボード304、イメージスキャナ305、フロッピード
ライブ306、ディスプレイ装置307をシステムバス
308により接続したコンピュータを利用してプログラ
ムにより実現される。図1に示した文字認識装置の稼働
時には、その各機能部101〜106、108の機能を
実現するためのプログラム310、制御情報テーブル1
07、及び各認識部103の認識辞書104は、ハード
ディスク装置302より、あるいはフロッピードライブ
306を介しフロッピーディスク(不図示)より、メモ
リ301にロードされる。それらの記憶域はROMに置
かれてもよい。処理すべき文書イメージ等は、イメージ
スキャナ305より入力されてメモリ301に読み込ま
れ、あるいはハードディスク装置302に一旦蓄積さ
れ、必要な時にメモり301に読み込まれる。ユーザか
らのモード指定情報等はキーボード304より入力され
る。最終的な認識結果は、ディスプレイあるいはプリン
タ303に出力され、あるいはハードディスク装置30
2又はフロッピードライブ306に挿入されたフロッピ
ーディスクに書き出される。
The character recognition device described above has a CPU 300 and a memory 30 as shown schematically in FIG.
1, a hard disk device 302, a printer 303, a keyboard 304, an image scanner 305, a floppy drive 306, and a display device 307 are realized by a program using a computer connected by a system bus 308. When the character recognition device shown in FIG. 1 operates, the program 310 for realizing the functions of the functional units 101 to 106 and 108 and the control information table 1
07 and the recognition dictionary 104 of each recognition unit 103 are loaded into the memory 301 from the hard disk device 302 or from a floppy disk (not shown) via the floppy drive 306. Their storage may be located in ROM. A document image or the like to be processed is input from the image scanner 305 and read into the memory 301, or is temporarily stored in the hard disk device 302, and is read into the memory 301 when necessary. Mode designation information and the like from the user are input from the keyboard 304. The final recognition result is output to the display or the printer 303 or the hard disk drive 30
2 or a floppy disk inserted into the floppy drive 306.

【0024】次に、各モードで選択される1つ又は2つ
の認識部の決定方法に関して説明する。まず、認識精度
であるが、これは予め用意した実験データで実際に認識
を行い、その正解率、誤認率、拒否率によって評価する
ことができる。この認識精度の評価値としては、例えば
評価値V=拒否率+K×誤認率 (ただしK>0)
が用いられる。実験データ中のあるカテゴリCと認識さ
れるべきサンプルの集合の中で、認識結果が認識拒否と
なったサンプルの割合が拒否率であり、カテゴリC以外
のカテゴリと誤認識されたサンプルの割合が誤認率であ
る。全てのカテゴリ又は一部のカテゴリについての拒否
率、誤認率の統計処理によって、その値を決定し、それ
を用いて評価値Vを決定することができる。この評価値
Vが小さいほど、認識精度が高いと評価される。
Next, a method of determining one or two recognition units selected in each mode will be described. First, regarding recognition accuracy, this can be evaluated by actually recognizing with experimental data prepared in advance and using the correct answer rate, false recognition rate, and rejection rate. As the evaluation value of the recognition accuracy, for example, evaluation value V = rejection rate + K × misrecognition rate (where K> 0)
Is used. In the set of samples to be recognized as a certain category C in the experimental data, the percentage of samples whose recognition results were rejected is the rejection rate, and the percentage of samples incorrectly recognized as categories other than category C is The misperception rate. Statistical processing of the rejection rate and the misrecognition rate for all or some categories can determine the value, and the evaluation value V can be determined using the value. The smaller the evaluation value V, the higher the recognition accuracy.

【0025】次に、速度優先(1)モードで利用される
1つの認識部を選ぶ方法について説明する。図6は、認
識部Mi,Mj,Mkの認識精度評価値及び認識速度をプ
ロットしたグラフである。縦軸は認識精度評価値V、横
軸は認識速度である。認識速度は各認識部を用いた実験
データの認識実験により求められた1秒あたりに認識で
きる文字数(CPS)である。Vsは認識精度評価値の
基準値である。速度優先(1)モードの場合、認識精度
評価値VがVsより小さい認識部の中で、認識速度が最
も速い認識部、すなわち図5の例では認識部Mkが選ば
れ、これが制御情報テーブル107の速度優先(1)モ
ードのエントリーの認識手段(1)のフィールドに指定
される。
Next, a method of selecting one recognition unit used in the speed priority (1) mode will be described. FIG. 6 is a graph in which recognition accuracy evaluation values and recognition speeds of the recognition units Mi, Mj, and Mk are plotted. The vertical axis is the recognition accuracy evaluation value V, and the horizontal axis is the recognition speed. The recognition speed is the number of characters that can be recognized per second (CPS) determined by a recognition experiment of experimental data using each recognition unit. Vs is a reference value of the recognition accuracy evaluation value. In the case of the speed priority (1) mode, among the recognition units whose recognition accuracy evaluation value V is smaller than Vs, the recognition unit with the highest recognition speed, that is, the recognition unit Mk in the example of FIG. 5 is selected. Speed priority (1) mode entry is specified in the field of the recognition means (1).

【0026】次に、速度優先(2)モードで利用される
2つの認識部を選ぶ方法について説明する。図7は、2
つの認識部の組合せによる認識精度評価値Vと認識速度
をプロットしたグラフである。縦軸と横軸は図6と同様
に認識精度評価値と認識速度であるが、この場合は、組
み合わせた2つの認識部の認識結果を統合した結果に関
する認識精度評価値であり、これは全てのカテゴリ又は
一部のカテゴリについて統計処理した値である。この統
合は図4に関連して述べたとおりであるが、そのための
各認識部のカテゴリ別の認識評価値V及び閾値th,thr
v,trejは予め求められている必要がある(th,thrv,t
rejの求め方については後述)。図7には、3つの認識
部Mi,Mj,Mkより選ばれた2つの認識部の組合せ
{Mi,Mj},{Mj,Mk},{Mi,Mk}の評価値及
び認識速度がプロットされている。認識精度の評価値が
その基準値Vsより小さい認識部の組合せの中で、認識
速度が最も速いものが選ばれる。ここに示した例では、
認識部Mi,Mkの組合せが選ばれ、それぞれが制御情報
テーブル107の速度優先(2)モードのエントリーの
認識手段(1),(2)の各フィールドに指定される。
Next, a method for selecting two recognition units used in the speed priority (2) mode will be described. FIG.
5 is a graph in which a recognition accuracy evaluation value V and a recognition speed by a combination of two recognition units are plotted. The vertical axis and the horizontal axis are the recognition accuracy evaluation value and the recognition speed as in FIG. 6, but in this case, are the recognition accuracy evaluation values related to the results obtained by integrating the recognition results of the two recognition units that have been combined. Of some or some categories. This integration is as described with reference to FIG. 4. For this purpose, the recognition evaluation value V and the threshold values th and thr of the respective recognition units for each category.
v and trej need to be obtained in advance (th, thrv, t
How to find rej will be described later). FIG. 7 plots the evaluation values and the recognition speeds of the combinations {Mi, Mj}, {Mj, Mk}, {Mi, Mk} of the two recognition units selected from the three recognition units Mi, Mj, and Mk. ing. Among the combinations of the recognition units whose evaluation values of the recognition accuracy are smaller than the reference value Vs, the combination with the highest recognition speed is selected. In the example shown here,
A combination of the recognition units Mi and Mk is selected, and each is specified in each field of the recognition means (1) and (2) of the entry of the speed priority (2) mode in the control information table 107.

【0027】次に、精度優先(1)モードで利用される
1つの認識部を選ぶ方法について説明する。図8は、認
識部Mi,Mj,Mkの認識精度評価値及び認識速度をプ
ロットしたグラフであり、縦軸は認識精度評価値V、横
軸は認識速度である。精度優先(1)モードの場合、認
識速度がその基準値CPSsより速い認識部の中で、認
識精度評価値Vが最も小さい(評価が最高の)1つの認
識部が選ばれる。ここに示す例では認識部Mkが選ば
れ、これが制御情報テーブル107の精度優先(1)モ
ードのエントリーの認識手段(1)のフィールドに指定
される。
Next, a method of selecting one recognition unit used in the accuracy priority (1) mode will be described. FIG. 8 is a graph in which the recognition accuracy evaluation values and the recognition speeds of the recognition units Mi, Mj, and Mk are plotted. The vertical axis indicates the recognition accuracy evaluation value V, and the horizontal axis indicates the recognition speed. In the case of the accuracy priority (1) mode, one recognition unit having the smallest (highest evaluation) recognition accuracy evaluation value V is selected from among the recognition units whose recognition speed is faster than the reference value CPSs. In the example shown here, the recognition unit Mk is selected, and this is specified in the field of the recognition means (1) of the entry of the precision priority (1) mode in the control information table 107.

【0028】次に、精度優先(2)モードで利用される
2つの認識部を選ぶ方法について説明する。図9は、2
つの認識部の組合せによる認識精度評価値Vと認識速度
をプロットしたグラフである。縦軸と横軸は認識精度評
価値と認識速度であるが、この場合は、速度優先(2)
モードの場合と同様に、組み合わせた2つの認識部の認
識結果を統合した結果に関する認識精度評価値であり、
これは全てのカテゴリ又は一部のカテゴリについて統計
処理した値である。この統合は図4に関連して述べたと
おりであるが、そのための各認識部のカテゴリ別の認識
評価値V及び閾値th,thrv,trejは予め求められている
必要がある(th,thrv,trejの求め方については後
述)。図9には、3つの認識部Mi,Mj,Mkより選ば
れた2つの認識部の組合せ{Mi,Mj},{Mj,M
k},{Mk,Mi}の評価値及び認識速度がプロットさ
れている。認識速度がその基準値CPSsより速い認識
部の組合せの中で、認識精度評価値Vが最も小さいもの
が選ばれる。ここに示した例では、認識部Mk,Miの組
合せが選ばれ、それぞれが制御情報テーブル107の精
度優先(2)モードのエントリーの認識手段(1),
(2)の各フィールドに指定される。
Next, a method of selecting two recognition units used in the accuracy priority (2) mode will be described. FIG.
5 is a graph in which a recognition accuracy evaluation value V and a recognition speed by a combination of two recognition units are plotted. The vertical axis and the horizontal axis are the recognition accuracy evaluation value and the recognition speed. In this case, speed priority (2)
As in the case of the mode, the recognition accuracy evaluation value related to the result obtained by integrating the recognition results of the two combined recognition units,
This is a value obtained by statistically processing all or some of the categories. This integration is as described with reference to FIG. 4. For this purpose, the recognition evaluation value V and the threshold values th, thrv, and trej of each recognition unit for each category need to be obtained in advance (th, thrv, trj). (How to find trej will be described later.) FIG. 9 shows a combination {Mi, Mj}, {Mj, M of two recognizers selected from three recognizers Mi, Mj, Mk.
The evaluation values and the recognition speed of k}, {Mk, Mi} are plotted. Among the combinations of the recognition units whose recognition speed is faster than the reference value CPSs, the combination with the smallest recognition accuracy evaluation value V is selected. In the example shown here, a combination of the recognition units Mk and Mi is selected, and each of them is a means (1) for recognizing an entry in the precision priority (2) mode of the control information table 107.
It is specified in each field of (2).

【0029】なお、認識精度(1)又は(2)のモード
において、正解率向上を優先させるモードと、誤認率低
減を優先させるモードとに細分することも可能である。
The mode of the recognition accuracy (1) or (2) can be subdivided into a mode for giving priority to the improvement of the correct answer rate and a mode for giving priority to the reduction of the false recognition rate.

【0030】次に、図4のステップ205で用いられる
閾値thについて説明する。図10は、その説明のための
図である。速度優先(2)又は精度優先(2)のモード
で利用される2つの認識部をMj,Mkとする。認識実験
データの中で、Mjによって認識拒否とされ、Mkによっ
てあるカテゴリCと認識されたデータの集合をV(j,
?,k,C)とする。このデータ集合V(j,?,k,
C)のデータと、Mkの辞書DkのカテゴリCのテンプレ
ートT(k,C)との距離の最大値、最小値をdmax,
dminとする。dmaxとdminの間のある値thrvを閾値と
して、T(k,C)との距離値がthrvより小さければC
を、thrv以上であれば認識拒否(?)を、認識結果の統
合結果とすることによって、データ集合V(j,?,
k,C)に関する認識精度評価値V(k)を求める。閾値
thrvを変えて同様の手順で認識精度評価値V(k)を求め
る。そして、認識精度評価値V(k)が最小になる閾値th
rvを認識部MkのカテゴリCに関する閾値thとし、これ
を辞書DkのカテゴリCに閾値thのフィールドに格納す
る。他のカテゴリについても、また認識部Mjの各カテ
ゴリについても同様にして閾値thを決定する。
Next, the threshold value th used in step 205 in FIG. 4 will be described. FIG. 10 is a diagram for explaining this. The two recognition units used in the speed priority (2) or accuracy priority (2) mode are Mj and Mk. In the recognition experiment data, a set of data rejected by Mj and recognized as a certain category C by Mk is represented by V (j,
? , K, C). This data set V (j,?, K,
C) and the maximum value and the minimum value of the distance between the template T (k, C) of the category C of the dictionary Dk of Mk and dmax,
dmin. When a certain value thrv between dmax and dmin is set as a threshold, if the distance value from T (k, C) is smaller than thrv, C
, And if the value is thrv or more, the recognition rejection (?) Is used as the integration result of the recognition results, so that the data set V (j,?,
k, C) is obtained. Threshold
The recognition accuracy evaluation value V (k) is obtained in a similar procedure by changing thrv. Then, the threshold th at which the recognition accuracy evaluation value V (k) is minimized
rv is the threshold th for the category C of the recognition unit Mk, and this is stored in the field of the threshold th in the category C of the dictionary Dk. The threshold value th is similarly determined for other categories and for each category of the recognition unit Mj.

【0031】次に、図4のステップ211で用いられる
認識精度評価値V(j),V(k)、及びステップ213,
223で用いられる閾値thrv(j),thrv(k),trej
(j),trej(k)について説明する。利用される2つの認
識部をMj,Mkとし、認識実験データの中で、Mjによ
ってカテゴリC1と認識され、MkによってカテゴリC2
と認識されたデータの集合をV(j,C1,k,C2)と
する。
Next, the recognition accuracy evaluation values V (j) and V (k) used in step 211 of FIG.
Thresholds thrv (j), thrv (k), trej used in H.223
(j) and trej (k) will be described. The two recognition units used are Mj and Mk. In the recognition experiment data, the category C1 is recognized by Mj, and the category C2 is recognized by Mk.
Is a set of data recognized as V (j, C1, k, C2).

【0032】まず、Mjに関するV(j),thrv(j),tre
j(j)について説明する。図11(A)は、その説明の
ための図である。データ集合V(j,C1,k,C2)の
データと、Mjの辞書DjのカテゴリC1のテンプレート
T(j,C1)との距離の最大値、最小値をdmax,dmi
nとする。dmaxとdminの間のある値thrv(j),trej
(j)(ただし後者は前者より大きい)を閾値として、T
(j,C1)との距離値がthrv(j)より小さければC1
を、thrv(j)とtrej(j)の間であればC2を、trej(j)
より大きければ認識拒否(?)をそれぞれMj,Mkの認
識結果の統合結果とすることによって、データ集合V
(j,C1,k,C2)に関する認識精度評価値V(j)を
求める。閾値thrv(j),trej(j)を変えて同様の手順で
認識精度評価値V(j)を求める。そして、認識精度評価
値V(j)が最小になる閾値thrv(j),trej(j)と、最小
の評価値V(j)を辞書DjのカテゴリC1の閾値thrv,t
rej及び評価値Vのフィールドにそれぞれ格納する。他
のカテゴリについても同様である。
First, V (j), thrv (j), tre for Mj
j (j) will be described. FIG. 11A is a diagram for explaining this. The maximum value and the minimum value of the distance between the data of the data set V (j, C1, k, C2) and the template T (j, C1) of the category C1 of the dictionary Dj of Mj are dmax, dmi.
Let it be n. a certain value between dmax and dmin thrv (j), trej
(j) (the latter is larger than the former)
If the distance value from (j, C1) is smaller than thrv (j), C1
, If it is between thrv (j) and trej (j), C2 and trej (j)
If it is larger, the rejection (?) Is regarded as the integration result of the recognition results of Mj and Mk, respectively, so that the data set V
A recognition accuracy evaluation value V (j) for (j, C1, k, C2) is obtained. The recognition accuracy evaluation value V (j) is obtained in a similar procedure by changing the thresholds thrv (j) and trej (j). Then, thresholds thrv (j) and trej (j) at which the recognition accuracy evaluation value V (j) is minimized and thresholds thrv and trv of the category C1 of the dictionary Dj are calculated.
rej and the evaluation value V are stored in the respective fields. The same applies to other categories.

【0033】Mkに関するV(k),thrv(k),trej(k)
も同様に決定される。図11(B)は、その説明のため
の図である。データ集合V(j,C1,k,C2)のデー
タと、Mkの辞書DkのカテゴリC2のテンプレートT
(k,C2)との距離の最大値、最小値をdmax,dmin
とする。dmaxとdminの間のある値thrv(k),trej(k)
(ただし後者は前者より大きい)を閾値として、T
(k,C2)との距離値がthrv(k)より小さければC2
を、thrv(k)とtrej(k)の間であればC1を、trej(k)
より大きければ認識拒否(?)をそれぞれMj,Mkの認
識結果の統合結果とすることによって、データ集合V
(j,C1,k,C2)に関する認識精度評価値V(k)を
求める。閾値thrv(k),trej(k)を変えて同様の手順で
認識精度評価値V(k)を求める。そして、認識精度評価
値V(k)が最小になる閾値thrv(k),trej(k)と、最小
の評価値V(k)を辞書DkのカテゴリC2の閾値thrv,t
rej及び評価値Vのフィールドにそれぞれ格納する。他
のカテゴリについても同様である。
V (k), thrv (k), trej (k) for Mk
Is similarly determined. FIG. 11 (B) is a diagram for explaining this. Data of data set V (j, C1, k, C2) and template T of category C2 of dictionary Dk of Mk
The maximum and minimum values of the distance from (k, C2) are dmax and dmin
And a certain value between dmax and dmin thrv (k), trej (k)
(However, the latter is larger than the former)
If the distance value to (k, C2) is smaller than thrv (k), C2
, If it is between thrv (k) and trej (k), C1 and trej (k)
If it is larger, the rejection (?) Is regarded as the integration result of the recognition results of Mj and Mk, respectively, so that the data set V
A recognition accuracy evaluation value V (k) for (j, C1, k, C2) is obtained. The recognition accuracy evaluation value V (k) is obtained in a similar procedure by changing the threshold values thrv (k) and trej (k). Then, thresholds thrv (k) and trej (k) at which the recognition accuracy evaluation value V (k) becomes the minimum and thresholds thrv and trv of the category C2 of the dictionary Dk are obtained.
rej and the evaluation value V are stored in the respective fields. The same applies to other categories.

【0034】なお、前述の実施例においては、速度優先
(2)又は精度優先(2)のモードで2つの認識部が選
択されたが、3つ以上の認識部を選択するようにするこ
とも可能である。この場合においても、利用される認識
部の選び方、認識結果の統合のためのパラメータの決定
方法は同様に考えればよい。
In the above-described embodiment, two recognition units are selected in the speed priority (2) or accuracy priority (2) mode. However, three or more recognition units may be selected. It is possible. Also in this case, the method of selecting the recognition unit to be used and the method of determining the parameters for integrating the recognition results may be similarly considered.

【0035】[0035]

【発明の効果】以上の説明から明らかなように、本発明
によれば、認識結果の統合に入力文字イメージの質を反
映させることができるため、入力文字イメージの質が変
動するような場合にも認識結果の統合を的確に行うこと
ができ、したがって、より一層の認識精度の向上を達成
可能である。また、利用する認識手段の選択及び個数を
制御することにより、文字認識の利用目的や認識対象の
文字イメージの品質などに応じて、認識精度がある程度
犠牲になるが高速性が優先される環境、高速性が優先さ
れるが一定レベル以上の認識精度も達成される環境、高
速性がある程度犠牲になるが認識精度が優先される環
境、又は、認識精度が優先されるが一定レベル以上の高
速性も達成される環境で文字認識装置を動作させること
が可能になる等の効果を得られる。
As is apparent from the above description, according to the present invention, since the quality of the input character image can be reflected in the integration of the recognition results, when the quality of the input character image fluctuates. Thus, the integration of the recognition results can be performed accurately, so that the recognition accuracy can be further improved. In addition, by controlling the selection and number of recognition means to be used, an environment where recognition accuracy is sacrificed to some extent but high-speed performance is prioritized according to the purpose of character recognition and the quality of the character image to be recognized, An environment in which high-speed performance is prioritized but recognition accuracy above a certain level is achieved, an environment in which high-speed performance is sacrificed to some extent but recognition accuracy is prioritized, or where recognition accuracy is prioritized but high-speed performance over a certain level In this case, it is possible to operate the character recognition device in an environment where the above is achieved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例による文字認識装置の概略ブ
ロック図である。
FIG. 1 is a schematic block diagram of a character recognition device according to one embodiment of the present invention.

【図2】前記文字認識装置の制御情報テーブルの説明図
である。
FIG. 2 is an explanatory diagram of a control information table of the character recognition device.

【図3】前記文字認識装置の認識辞書の説明図である。FIG. 3 is an explanatory diagram of a recognition dictionary of the character recognition device.

【図4】前記文字認識装置の統合部の処理を示すフロー
チャートである。
FIG. 4 is a flowchart showing a process of an integration unit of the character recognition device.

【図5】前記文字認識装置をコンピュータを利用してソ
フトウエアにより実現するための構成の一例を簡略化し
て示すブロック図である。
FIG. 5 is a simplified block diagram showing an example of a configuration for realizing the character recognition device by software using a computer.

【図6】速度優先(1)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 6 is a graph for explaining how to select a recognition unit used in the speed priority (1) mode.

【図7】速度優先(2)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 7 is a graph for explaining how to select a recognition unit used in a speed priority (2) mode.

【図8】精度優先(1)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 8 is a graph for explaining how to select a recognition unit used in the accuracy priority (1) mode.

【図9】精度優先(2)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 9 is a graph for explaining how to select a recognition unit used in the accuracy priority (2) mode.

【図10】認識拒否を含む2つの認識結果の統合のため
の閾値thを求める方法の説明のための図である。
FIG. 10 is a diagram for explaining a method of calculating a threshold th for integrating two recognition results including rejection of recognition.

【図11】認識拒否を含まない2つの異なった認識結果
の統合のための閾値thrv,trjおよび最小の認識精度
評価値を求める方法の説明のための図である。
FIG. 11 is a diagram for explaining a method of obtaining thresholds thrv, trj and a minimum recognition accuracy evaluation value for integrating two different recognition results that do not include rejection of recognition.

【符号の説明】[Explanation of symbols]

101 イメージ入力部 102 前処理部 103 認識部(M1,M2,...,Mn) 104 認識辞書(D1,D2,...,Dn) 105 認識制御部 106 統合部 107 制御情報テーブル 108 出力部 109 ユーザ入力部 300 CPU 301 メモリ 302 ハードディスク装置 303 プリンタ 304 キーボード 305 イメージスキャナ 306 フロッピードライブ 307 ディスプレイ装置 308 システムバス 310 文字認識処理のためのプログラム Reference Signs List 101 Image input unit 102 Preprocessing unit 103 Recognition unit (M1, M2, ..., Mn) 104 Recognition dictionary (D1, D2, ..., Dn) 105 Recognition control unit 106 Integration unit 107 Control information table 108 Output unit 109 User input unit 300 CPU 301 Memory 302 Hard disk device 303 Printer 304 Keyboard 305 Image scanner 306 Floppy drive 307 Display device 308 System bus 310 Program for character recognition processing

【手続補正書】[Procedure amendment]

【提出日】平成9年10月2日[Submission date] October 2, 1997

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】図面の簡単な説明[Correction target item name] Brief description of drawings

【補正方法】追加[Correction method] Added

【補正内容】[Correction contents]

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例による文字認識装置の概略ブ
ロック図である。
FIG. 1 is a schematic block diagram of a character recognition device according to one embodiment of the present invention.

【図2】前記文字認識装置の制御情報テーブルの説明図
である。
FIG. 2 is an explanatory diagram of a control information table of the character recognition device.

【図3】前記文字認識装置の認識辞書の説明図である。FIG. 3 is an explanatory diagram of a recognition dictionary of the character recognition device.

【図4】前記文字認識装置の統合部の処理を示すフロー
チャートである。
FIG. 4 is a flowchart showing a process of an integration unit of the character recognition device.

【図5】前記文字認識装置をコンピュータを利用してソ
フトウエアにより実現するための構成の一例を簡略化し
て示すブロック図である。
FIG. 5 is a simplified block diagram showing an example of a configuration for realizing the character recognition device by software using a computer.

【図6】速度優先(1)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 6 is a graph for explaining how to select a recognition unit used in the speed priority (1) mode.

【図7】速度優先(2)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 7 is a graph for explaining how to select a recognition unit used in a speed priority (2) mode.

【図8】精度優先(1)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 8 is a graph for explaining how to select a recognition unit used in the accuracy priority (1) mode.

【図9】精度優先(2)モードで利用される認識部の選
び方を説明するためのグラフである。
FIG. 9 is a graph for explaining how to select a recognition unit used in the accuracy priority (2) mode.

【図10】認識拒否を含む2つの認識結果の統合のため
の閾値thを求める方法の説明のための図である。
FIG. 10 is a diagram for explaining a method of calculating a threshold th for integrating two recognition results including rejection of recognition.

【図11】認識拒否を含まない2つの異なった認識結果
の統合のための閾値thrv,trjおよび最小の認識精度
評価値を求める方法の説明のための図である。
FIG. 11 is a diagram for explaining a method of obtaining thresholds thrv, trj and a minimum recognition accuracy evaluation value for integrating two different recognition results that do not include rejection of recognition.

【図12】決定マトリックスの一例を示す図である。FIG. 12 is a diagram illustrating an example of a decision matrix.

【符号の説明】 101 イメージ入力部 102 前処理部 103 認識部(M1,M2,...,Mn) 104 認識辞書(D1,D2,...,Dn) 105 認識制御部 106 統合部 107 制御情報テーブル 108 出力部 109 ユーザ入力部 300 CPU 301 メモリ 302 ハードディスク装置 303 プリンタ 304 キーボード 305 イメージスキャナ 306 フロッピードライブ 307 ディスプレイ装置 308 システムバス 310 文字認識処理のためのプログラム[Description of Signs] 101 Image Input Unit 102 Preprocessing Unit 103 Recognition Unit (M1, M2, ..., Mn) 104 Recognition Dictionary (D1, D2, ..., Dn) 105 Recognition Control Unit 106 Integration Unit 107 Control Information table 108 Output unit 109 User input unit 300 CPU 301 Memory 302 Hard disk device 303 Printer 304 Keyboard 305 Image scanner 306 Floppy drive 307 Display device 308 System bus 310 Program for character recognition processing

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 文字イメージのデータを入力する手段
と、入力された文字イメージと辞書のテンプレート又は
標準パターンとの整合をとり、認識結果とともにテンプ
レートとの距離値を出力する複数の認識手段と、該複数
の認識手段より少なくとも1つの認識手段を選択して動
作させる手段と、該認識手段が複数選択されて動作させ
られる場合に、該選択された認識手段より出力された認
識結果を統合して最終的な認識結果を決定する統合手段
とを具備し、該統合手段は、該選択された複数の認識手
段より出力された距離値を、該選択された複数の認識手
段より出力された認識結果の統合に利用することを特徴
とする文字認識装置。
1. A means for inputting data of a character image, a plurality of recognition means for matching the input character image with a template or a standard pattern of a dictionary and outputting a distance value from the template together with a recognition result; Means for selecting and operating at least one recognizing means from the plurality of recognizing means, and integrating the recognition results output from the selected recognizing means when the plurality of recognizing means are selected and operated. Integrating means for determining a final recognition result, wherein the integrating means converts the distance value output from the selected plurality of recognition means to the recognition result output from the selected plurality of recognition means. A character recognition device characterized in that it is used for integrating characters.
【請求項2】 選択された2つの認識手段中の一方の認
識手段の認識結果が認識拒否で、他方の認識手段の認識
結果があるカテゴリCである場合、該統合手段は、該他
方の認識手段のカテゴリCに関して予め用意された閾値
thに比べ該他方の認識手段より出力された距離値が小
さいときに、カテゴリCを最終的な認識結果とし、そう
でないときに認識拒否を最終的な認識結果とすることを
特徴とする請求項1記載の文字認識装置。
2. If the recognition result of one of the two selected recognition means is rejection of recognition and the recognition result of the other recognition means is in a certain category C, the integration means selects the other recognition means. When the distance value output from the other recognition means is smaller than the threshold value th prepared in advance for the category C of the means, the category C is regarded as the final recognition result. The character recognition device according to claim 1, wherein the result is a result.
【請求項3】 選択された2つの認識手段中の一方の認
識手段の認識結果があるカテゴリCj、他方の認識手段
の認識結果があるカテゴリCkである場合、該統合手段
は、該一方の認識手段のカテゴリCjに関して予め用意
された認識精度評価値V(j)が該他方の認識手段のカテ
ゴリCkに関して予め用意された認識精度評価値V(k)
より小さいときには、該一方の認識手段のカテゴリCj
に関して予め用意された閾値thrv(j),trej(j)と該一
方の認識手段より出力された距離値d(j)との大小関係
が、d(j)<thrv(j)ならばカテゴリCjを、thrv(j)
≦d(j)<trej(j)ならばカテゴリCkを、d(j)≧tre
j(j)ならば認識拒否をそれぞれ最終的な認識結果と
し、該認識精度評価値V(j)が該認識精度評価値V(k)
以上のときには、該他方の認識手段のカテゴリCkに関
して予め用意された閾値thrv(k),trej(k)と該他方の
認識手段より出力された距離値d(k)との大小関係が、
d(k)<thrv(k)ならばカテゴリCkを、thrv(k)≦d
(k)<trej(k)ならばカテゴリCjを、d(k)≧trej
(k)ならば認識拒否をそれぞれ最終的な認識結果とす
る、ことを特徴とする請求項1記載の文字認識装置。
3. If the recognition result of one of the two selected recognition means is category Cj and the recognition result of the other recognition means is category Ck, the integration means performs the recognition on the one of the two recognition means. The recognition accuracy evaluation value V (j) prepared in advance for the category Cj of the means is the recognition accuracy evaluation value V (k) prepared in advance for the category Ck of the other recognition means.
If smaller, the category Cj of the one recognition means
If the magnitude relation between threshold values thrv (j), trej (j) prepared in advance and the distance value d (j) output from the one recognition means is d (j) <thrv (j), the category Cj To thrv (j)
If ≦ d (j) <trej (j), the category Ck is set, and d (j) ≧ tre
If j (j), the rejection is regarded as the final recognition result, and the recognition accuracy evaluation value V (j) is used as the recognition accuracy evaluation value V (k).
In the above case, the magnitude relation between threshold values thrv (k) and trej (k) prepared in advance for the category Ck of the other recognition means and the distance value d (k) output from the other recognition means is as follows.
If d (k) <thrv (k), category Ck is set, and thrv (k) ≦ d
If (k) <trej (k), then category Cj, d (k) ≧ trej
2. The character recognition device according to claim 1, wherein if (k), the rejection is regarded as a final recognition result.
【請求項4】 ユーザがモードを指定するための手段を
有し、該認識手段を選択する手段は、ユーザによるモー
ド指定に従って、認識速度を優先して予め選定された1
つの認識手段、認識速度を優先して予め選定された複数
の認識手段、認識精度を優先して予め選定された1つの
認識手段、又は認識精度を優先して予め選定された複数
の認識手段を選択して動作させることを特徴とする請求
項1記載の文字認識装置。
4. A user has means for designating a mode, and the means for selecting the recognition means is one which has been selected in advance by giving priority to the recognition speed in accordance with the mode designation by the user.
One recognition means, a plurality of recognition means pre-selected with priority on recognition speed, one recognition means pre-selected with priority on recognition accuracy, or a plurality of recognition means pre-selected with priority on recognition accuracy The character recognition device according to claim 1, wherein the character recognition device is selected and operated.
【請求項5】 ユーザがモードを指定するための手段を
有し、該認識手段を選択する手段は、ユーザによるモー
ド指定に従って、認識速度を優先して予め選定された2
つの認識手段、又は、認識精度を優先して予め選定され
た2つの認識手段を選択して動作させることを特徴とす
る請求項2又は3記載の文字認識装置。
5. A user has means for designating a mode, and said means for selecting the recognition means is a means which is selected in advance by giving priority to the recognition speed in accordance with the mode designation by the user.
4. The character recognition device according to claim 2, wherein one of two recognition means or two recognition means selected in advance with priority given to recognition accuracy is selected and operated.
JP9195444A 1997-07-22 1997-07-22 Character recognizing device Pending JPH1139430A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9195444A JPH1139430A (en) 1997-07-22 1997-07-22 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9195444A JPH1139430A (en) 1997-07-22 1997-07-22 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH1139430A true JPH1139430A (en) 1999-02-12

Family

ID=16341176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9195444A Pending JPH1139430A (en) 1997-07-22 1997-07-22 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH1139430A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100046840A1 (en) * 2008-08-20 2010-02-25 Canon Kabushiki Kaisha Image processing apparatus and image processing method for evaluating a plurality of image recognition processing units

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100046840A1 (en) * 2008-08-20 2010-02-25 Canon Kabushiki Kaisha Image processing apparatus and image processing method for evaluating a plurality of image recognition processing units
US8559728B2 (en) * 2008-08-20 2013-10-15 Canon Kabushiki Kaisha Image processing apparatus and image processing method for evaluating a plurality of image recognition processing units

Similar Documents

Publication Publication Date Title
JP2991779B2 (en) Character recognition method and device
JPH0612524A (en) Character recognizing system
US6035062A (en) Character recognition method and apparatus
JPH1139430A (en) Character recognizing device
JP3319203B2 (en) Document filing method and apparatus
US5787202A (en) Character recognition apparatus
JP2001022883A (en) Character recognizing system and recording medium for realizing function for the same
JP2848560B2 (en) Image recognition method and apparatus
JPH07334611A (en) Display method for non-recognized character
JPH08101880A (en) Character recognition device
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JPH06251187A (en) Method and device for correcting character recognition error
JPH06337966A (en) Character recognizing device
JPH0620098A (en) Character recognition device
JPH0991386A (en) Document analyzing device and morpheme analyzing method
JP3045086B2 (en) Optical character reading method and apparatus
JPH07117982B2 (en) Pattern recognition method
JPH06208649A (en) Character recognizing device
JPH05189604A (en) Optical character reader
JPH0765128A (en) Method for generating dictionary for type character recognition
JP2002074262A (en) Method for correcting recognition character
JPH0460784A (en) Character recognition device
JPH103518A (en) Method for recognizing character and recording medium and device for recognizing character
JPH06176191A (en) Character recognition device
JPH07160820A (en) Character recognizing method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061213