JPH11242718A - Character recognizing device - Google Patents
Character recognizing deviceInfo
- Publication number
- JPH11242718A JPH11242718A JP10043153A JP4315398A JPH11242718A JP H11242718 A JPH11242718 A JP H11242718A JP 10043153 A JP10043153 A JP 10043153A JP 4315398 A JP4315398 A JP 4315398A JP H11242718 A JPH11242718 A JP H11242718A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- dictionary
- character
- accuracy
- recognition means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は文字認識装置に係
り、特に、複数の認識手段を備え、2つ以上の認識手段
の統合使用が可能な文字認識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device, and more particularly to a character recognition device having a plurality of recognition means and capable of integrally using two or more recognition means.
【0002】[0002]
【従来の技術】単一の認識手段を用いる方式の文字認識
装置と、複数の認識手段を統合使用する方式の文字認識
装置が知られている。後者の文字認識装置は、異なった
認識手法の認識手段によって同じ文字イメージに対し文
字認識を行い、それぞれの認識結果を統合して最終的な
認識結果を得るもので、これに関する公知文献は、特開
平7−271899号公報や、H.Yamagataほか,”A
HandwrittenCharacter Recognition of Multiple
Classifiers”,IEICETRANS,INF.&
SYST.,Vol.E79−D,No.5,MAY 199
6、L.Xuほか,”Methods of Combining Multiple
Classifiers andTheir Applications to Handwriti
ng Recognition”,IEEETRANSACTION
S ON SYSTEMS,MAN,ANDCYBERN
ETICS,VOL.22,NO.3,MAY/JUNE
1992など数多い。2. Description of the Related Art There are known a character recognizing apparatus of a type using a single recognizing means and a character recognizing apparatus of a type using a plurality of recognizing means. The latter character recognition device performs character recognition on the same character image by means of different recognition methods and integrates the respective recognition results to obtain a final recognition result. No. 7-271899, H. Yamagata et al., "A.
Handwritten Character Recognition of Multiple
Classifiers ", IEICETRANS, INF. &
SYST., Vol. E79-D, No. 5, MAY 199
6. L. Xu et al., “Methods of Combining Multiple”
Classifiers andTheir Applications to Handwriti
ng Recognition ”, IEEE TRANSACTION
SON SYSTEMS, MAN, ANDCYBERN
ETICS, VOL.22, NO.3, MAY / JUNE
1992 and many others.
【0003】[0003]
【発明が解決しようとする課題】従来、個々の認識手段
毎に固有の辞書が用意されており、複数の認識手段が統
合使用される場合も各認識手段はその固有の辞書を使用
する。すなわち、辞書に関しては、認識手段の単独使用
の場合と同じ扱いである。Heretofore, a unique dictionary has been prepared for each recognition means. Even when a plurality of recognition means are used in an integrated manner, each recognition means uses the unique dictionary. In other words, the dictionary is handled in the same manner as when the recognition means is used alone.
【0004】2つ以上の認識手段を統合使用するのは、
ある認識手段の弱点を他の認識手段で補完することによ
り、全体として認識精度を向上させることを意図してい
る。本発明の目的は、この弱点補完をより効果的に達成
できるよう辞書に関連した構成を改良した文字認識装置
を提供することにある。本発明のもう一つの目的は、認
識環境の変化(例えば、認識速度と認識精度の重要度の
変化、認識の対象となる文字種やフォント種類の変化な
ど)に柔軟に対応できる文字認識装置を提供することに
ある。[0004] The integrated use of two or more recognition means is:
It is intended to improve the recognition accuracy as a whole by complementing the weakness of a certain recognition means with another recognition means. An object of the present invention is to provide a character recognition device in which a configuration related to a dictionary is improved so that this weak point complementation can be achieved more effectively. Another object of the present invention is to provide a character recognition apparatus that can flexibly cope with changes in the recognition environment (for example, changes in the importance of recognition speed and recognition accuracy, changes in the types of characters and fonts to be recognized). Is to do.
【0005】[0005]
【課題を解決するための手段】前記目的を達成するた
め、請求項1記載の発明による文字認識装置は、複数の
認識手段を有し、2つ以上の認識手段を選択し統合使用
が可能なもので、各認識手段が、それに固有の辞書のほ
かに、他の認識手段との統合使用のための辞書を有し、
2つ以上の認識手段が統合使用される場合に、それら2
つ以上の認識手段中の主たる認識手段がそれに固有の辞
書を使用し、他の従たる認識手段が、それと主たる認識
手段との統合使用のための辞書を使用する構成とされ
る。In order to achieve the above object, a character recognition apparatus according to the present invention has a plurality of recognition means, and two or more recognition means can be selected for integrated use. Wherein each recognizer has, in addition to its own dictionary, a dictionary for integrated use with other recognizers,
If two or more recognition means are used together,
The main recognition means of the one or more recognition means uses its own dictionary, and the other sub-recognition means uses a dictionary for integrated use with the main recognition means.
【0006】請求項2記載の発明による文字認識装置
は、請求項1記載の発明による文字認識装置の構成に加
え、統合使用される2つ以上の認識手段中の主たる認識
手段によって誤認され又は認識されないデータサンプル
を収集する手段と、収集されたデータサンプルを利用し
て、それら2つ以上の認識手段中の従たる認識手段の、
主たる認識手段との統合使用のための辞書を作成又は更
新する手段とを具備する構成とされる。The character recognition device according to the second aspect of the present invention has the configuration of the character recognition device according to the first aspect of the present invention, and further includes a character recognition device that is erroneously recognized or recognized by a main recognition unit among two or more recognition units that are integrated and used. Means for collecting a data sample not to be processed, and utilizing the collected data sample for the secondary recognition means of the two or more recognition means.
Means for creating or updating a dictionary for integrated use with the main recognition means.
【0007】請求項3記載の発明による文字認識装置
は、複数の認識手段と、該複数の認識手段のそれぞれに
固有の複数の単独用辞書と、該複数の認識手段のそれぞ
れの他の認識手段との統合使用のための複数の統合用辞
書と、認識速度の優先又は認識精度の優先を指示するた
めの手段と、認識速度の優先が指示された場合に選択し
た1つの認識手段の単独使用により文字認識を行わせる
手段と、認識精度の優先が指示された場合に選択した2
つ以上の認識手段の統合使用により文字認識を行わせる
手段と、1つの認識手段の単独使用による文字認識の場
合に当該認識手段が用いる辞書として当該認識手段に固
有の単独用辞書を選択する手段と、2つ以上の認識手段
の統合使用による文字認識の場合に、当該2つ以上の認
識手段中の1つの主たる認識手段が用いる辞書として当
該主たる認識手段に固有の単独用辞書を選択し、他の従
たる各認識手段が用いる辞書として、当該従たる各認識
手段の当該主たる認識手段との統合使用のための統合用
辞書を選択する手段とを具備する構成とされる。According to a third aspect of the present invention, there is provided a character recognition apparatus, comprising: a plurality of recognition means; a plurality of independent dictionaries specific to each of the plurality of recognition means; and another recognition means for each of the plurality of recognition means. A plurality of integration dictionaries for integrated use with the unit, means for designating priority of recognition speed or priority of recognition accuracy, and single use of one recognition means selected when priority of recognition speed is designated Means for performing character recognition by the user and the two selected when priority is given to recognition accuracy.
Means for performing character recognition by the integrated use of one or more recognizing means, and means for selecting a single dictionary specific to the recognizing means as a dictionary used by the recognizing means in the case of character recognition by single use of one recognizing means. And, in the case of character recognition by integrated use of two or more recognition means, selecting a single dictionary unique to the main recognition means as a dictionary used by one main recognition means of the two or more recognition means, As a dictionary used by each of the other sub-recognition units, the sub-recognition unit includes a unit for selecting an integration dictionary for integrated use with the main recognition unit.
【0008】請求項4記載の発明による文字認識装置
は、請求項3記載の発明による文字認識装置の構成に加
え、認識対象を指示するための手段を有し、指示された
認識対象に応じて単独使用又は統合使用される認識手段
が選択される構成とされる。A character recognition device according to a fourth aspect of the present invention has means for designating a recognition target in addition to the configuration of the character recognition device according to the third aspect of the present invention. Recognition means used alone or integrated is selected.
【0009】請求項5記載の発明による文字認識装置
は、請求項3記載の発明による文字認識装置の構成に加
え、認識対象を指示するための手段と、認識精度レベル
を指示するための手段とを有し、認識速度の優先が指示
された場合において、認識精度レベルが指示されたとき
には指示された認識対象に対し指示された認識精度レベ
ルを満足する認識手段中で最も認識速度の速い認識手段
が選択され、認識精度レベルが指示されないときには指
示された認識対象に対し認識精度が最も高い認識手段が
選択される構成とされる。According to a fifth aspect of the present invention, in addition to the configuration of the character recognition apparatus according to the third aspect of the present invention, there are provided means for designating a recognition target and means for designating a recognition accuracy level. In the case where the priority of the recognition speed is instructed, when the recognition accuracy level is instructed, the recognition means having the fastest recognition speed among the recognition means satisfying the instructed recognition accuracy level for the instructed recognition target Is selected, and when the recognition accuracy level is not specified, a recognition unit having the highest recognition accuracy for the specified recognition target is selected.
【0010】請求項6記載の発明による文字認識装置
は、請求項3記載の発明による文字認識装置の構成に加
え、認識対象を指示するための手段と、認識速度レベル
を指示するための手段とを有し、認識精度の優先が指示
された場合において、認識速度レベルが指示されたとき
には指示された認識対象に対し指示された認識速度レベ
ルを満足する認識手段中で最も認識精度が高い認識手段
の組合せが選択され、認識速度レベルがされないときに
は指示された認識対象に対し認識精度が最も高い認識手
段の組合せが選択される構成とされる。A character recognition apparatus according to a sixth aspect of the present invention has a structure for designating a recognition target and a means for designating a recognition speed level, in addition to the configuration of the character recognition apparatus according to the third aspect of the invention. When priority is given to the recognition accuracy, when the recognition speed level is specified, the recognition unit having the highest recognition accuracy among the recognition units satisfying the specified recognition speed level for the specified recognition target. Is selected, and when the recognition speed level is not set, the combination of the recognition means having the highest recognition accuracy for the specified recognition target is selected.
【0011】[0011]
【発明の実施の形態】本発明による文字認識装置の一実
施例は、図1に示すように、複数の認識手段1と、複数
の単独用辞書2と、複数の統合用辞書3と、認識制御手
段4と、システム制御手段5と、統合用辞書作成・更新
手段6と、収集データ記憶手段7と、指示入力手段9
と、構成制御データ記憶手段8とから構成される。DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of a character recognition apparatus according to the present invention, as shown in FIG. 1, includes a plurality of recognition means 1, a plurality of single dictionaries 2, a plurality of integrated dictionaries 3, and Control means 4, system control means 5, integration dictionary creating / updating means 6, collected data storage means 7, instruction input means 9
And configuration control data storage means 8.
【0012】単独用辞書2はそれぞれ特定の認識手段に
固有の辞書である。統合用辞書3は、統合使用の場合に
主たる認識手段と従たる認識手段の組合せに対応して用
意される辞書であり、後述のように統合使用の場合に従
たる認識手段の辞書として用いられる。主たる認識手段
に弱点、すなわち認識できなかったり誤認する文字イメ
ージデータがある場合に、従たる認識手段で、そのよう
な文字イメージデータを認識可能にするための統合用辞
書3を用意することにより、主たる認識手段の弱点を効
果的に補完し、全体として認識精度を向上できる。The independent dictionary 2 is a dictionary specific to a specific recognition means. The integration dictionary 3 is a dictionary prepared corresponding to a combination of a main recognition unit and a secondary recognition unit in the case of integrated use, and is used as a dictionary of a recognition unit in accordance with the case of integrated use as described later. . When the main recognition unit has weaknesses, that is, character image data that cannot be recognized or is erroneously recognized, by preparing an integration dictionary 3 that enables such character image data to be recognized by the secondary recognition unit, The weakness of the main recognition means can be effectively supplemented, and the recognition accuracy can be improved as a whole.
【0013】各認識手段1の基本辞書たる単独用辞書2
は、各認識手段の総合的な認識性能を高めるように作成
されるため、上に述べたような誤認又は認識拒否される
文字イメージの特徴量を単独用辞書に追加登録すること
によって弱点を補おうとすると、逆に誤認文字が増加す
るなど総合的な認識性能が悪化する恐れがある。このよ
うな問題は、統合用辞書2で弱点を補完する方法であれ
ば回避できる。A single dictionary 2 which is a basic dictionary of each recognition means 1
Is created so as to enhance the overall recognition performance of each recognition means, so the weak points can be compensated by additionally registering the features of the character images that are misrecognized or rejected as described above in the single dictionary. Attempting to do so may adversely affect overall recognition performance, such as an increase in misidentified characters. Such a problem can be avoided by a method of complementing the weak points with the integration dictionary 2.
【0014】統合用辞書作成・更新手段6は、認識制御
手段4と連係して、上に述べたような主たる認識手段の
弱点を補完するための統合用辞書3の作成又は更新を行
う手段であり、その詳細は後述する。収集データ記憶手
段7は、統合用辞書の作成又は更新のために収集される
データサンプルの一時記憶のための手段である。The integration dictionary creating / updating means 6 is a means for coordinating with the recognition control means 4 to create or update the integration dictionary 3 for compensating for the weaknesses of the main recognition means as described above. Yes, the details of which will be described later. The collected data storage means 7 is a means for temporarily storing data samples collected for creating or updating the integration dictionary.
【0015】指示入力手段9は、文字認識装置のユーザ
が、認識動作又は統合用辞書作成/更新動作の指示、認
識精度優先又は認識速度優先の指示、要求する最低限の
認識精度レベル又は認識速度レベルの指示、認識対象
(数字、英字、ひらがな、カタカナ、記号、漢字などの
1文字種、又は2以上の文字種の混合、フォント種類な
ど)の指示、統合用辞書作成/更新動作時の主たる認識
手段と従たる認識手段の指定などをシステム制御手段5
に入力するための手段である。The instruction input means 9 is used by the user of the character recognition apparatus to instruct a recognition operation or an integrated dictionary creating / updating operation, an instruction to give priority to recognition accuracy or a priority to recognition speed, a minimum required recognition accuracy level or recognition speed. Level indication, indication of recognition target (one character type such as numbers, alphabets, hiragana, katakana, symbols, kanji, or a mixture of two or more character types, font type, etc.) The system control means 5
This is a means for inputting to.
【0016】システム制御手段5は、指示入力手段9か
ら入力される指示に応じて、認識手段や辞書の選択、認
識手段の単独使用と統合使用の切り替えなどの制御を行
う手段であるが、その詳細は後述する。構成制御データ
記憶手段8は、システム制御手段5によって参照される
構成制御データを記憶するものである。この構成制御デ
ータの内容については文字認識装置の動作に関連して後
述する。The system control means 5 is a means for controlling the selection of the recognition means and the dictionary, and switching between the independent use and the integrated use of the recognition means in accordance with the instruction input from the instruction input means 9. Details will be described later. The configuration control data storage unit 8 stores configuration control data referred to by the system control unit 5. The contents of the configuration control data will be described later in connection with the operation of the character recognition device.
【0017】認識制御手段4は、システム制御手段5に
よる制御に従って、1つの認識手段と1つの単独用辞
書、又は2つ(一般的には2つ以上)の認識手段と1つ
の単独用辞書及び1つ(一般的には1つ以上)の統合用
辞書を使用して、外部より文字イメージデータを取り込
んで文字認識を行わせ、1つの認識手段の単独使用の時
にはその認識結果をそのまま外部に出力させ、2つ(一
般的には2つ以上)の認識手段の統合使用の時にはそれ
ぞれの認識手段の認識結果を統合し、統合結果を外部に
出力させる手段である。According to the control of the system control means 5, the recognition control means 4 includes one recognition means and one single dictionary, or two (generally two or more) recognition means and one single dictionary and Using one (generally one or more) integration dictionary, character image data is fetched from outside and character recognition is performed. When one recognition unit is used alone, the recognition result is directly sent to the outside. In the case where two (generally two or more) recognition means are integrated and used, the recognition results of the respective recognition means are integrated, and the integrated result is output to the outside.
【0018】この文字認識装置は、専用のハードウェア
によって実現されるか、あるいは、例えば図2に示すよ
うなCPU100、メモリ101、キーボードなどの入
力装置103、イメージスキャナなどの外部の入力装置
との接続のための入力インターフェイス104、プリン
タやディスプレイなどの出力装置105、ハードディス
ク装置などの補助記憶装置102などをバス107で接
続した一般的構成のコンピュータ上で実現される。This character recognition device is realized by dedicated hardware, or is connected to an external input device such as a CPU 100, a memory 101, an input device 103 such as a keyboard or an image scanner as shown in FIG. It is realized on a computer having a general configuration in which an input interface 104 for connection, an output device 105 such as a printer or a display, and an auxiliary storage device 102 such as a hard disk device are connected by a bus 107.
【0019】図1と図2の対応関係は次の通りである。
複数の認識手段1、認識制御手段4、システム制御手段
5、統合用辞書作成・更新手段6は、それぞれメモリ1
01上の対応したプログラムP1,P4,P5,P6に
よって実現される。単独用辞書2、統合用辞書3はデー
タファイル又はテーブルデータなどとしてメモリ101
上に置かれる。収集データ記憶手段7及び構成制御デー
タ記憶手段8として、メモリ101(又は補助記憶装置
7)の特定の領域が割り当てられる。指示入力手段9と
しては入力装置103が用いられる。文字イメージデー
タは、例えば入力インターフェイス104を介して外部
から入力され、あるいは補助記憶装置102から入力さ
れる。メモリ101には、図示しないが、コンピュータ
の動作に必要なオペレーティングシステムなども当然に
ロードされる。The correspondence between FIG. 1 and FIG. 2 is as follows.
The plurality of recognition units 1, the recognition control unit 4, the system control unit 5, and the integration dictionary creating / updating unit 6 each include a memory 1
01 is realized by the corresponding programs P1, P4, P5, and P6. The independent dictionary 2 and the integrated dictionary 3 are stored in the memory 101 as data files or table data.
Put on top. Specific areas of the memory 101 (or the auxiliary storage device 7) are allocated as the collected data storage unit 7 and the configuration control data storage unit 8. The input device 103 is used as the instruction input unit 9. The character image data is input from the outside via the input interface 104 or from the auxiliary storage device 102, for example. Although not shown, an operating system and the like necessary for the operation of the computer are naturally loaded in the memory 101.
【0020】図3乃至図5はシステム制御手段5の制御
フローを示すフローチャートである。このフローチャー
トと図1(必要に応じて図2)を参照して、この文字認
識装置の動作を説明する。FIGS. 3 to 5 are flowcharts showing the control flow of the system control means 5. The operation of the character recognition device will be described with reference to this flowchart and FIG. 1 (FIG. 2 as necessary).
【0021】システム制御手段5において、まずユーザ
による指示が認識動作であるか統合用辞書作成又は更新
動作であるかを調べる(ステップS1)。認識動作が指
示された場合、ユーザによる指示が認識精度優先である
か認識速度優先であるかを判定する(ステップS2)。The system control means 5 first checks whether the user's instruction is a recognition operation or an integration dictionary creation or update operation (step S1). When the recognition operation is instructed, it is determined whether the user's instruction is prioritized in recognition accuracy or in recognition speed (step S2).
【0022】認識速度優先が指示された場合について以
下説明する。認識速度優先の場合、1つの認識手段1の
単独使用となる。システム制御手段5は、使用する認識
手段の選択のために、ユーザにより認識精度レベルが指
示されているか調べる(ステップS3)。認識精度レベ
ルが指示されていないときには、構成制御データ記憶手
段8に記憶されている構成制御データに基づいて、ユー
ザに指示された認識対象に対し最も高い認識精度を期待
できる認識手段1を1つ選定する(ステップS4)。認
識精度レベルが指示されているときには、構成制御デー
タに基づいて、ユーザに指示された認識対象に対し、指
示された認識精度レベル以上の認識精度を期待できる最
も認識速度の速い認識手段1を選定する(ステップS
5)。次に構成制御データに基づいて、選定した認識手
段1に固有の単独用辞書2を選定し(ステップS6)、
認識制御手段4に対し、1つの認識手段の単独使用によ
る文字認識処理の開始を指示する(ステップS7)。A case where the recognition speed priority is instructed will be described below. In the case of giving priority to the recognition speed, one recognition unit 1 is used independently. The system control unit 5 checks whether or not the recognition accuracy level is specified by the user for selecting the recognition unit to be used (step S3). When the recognition accuracy level is not specified, one recognition unit 1 that can expect the highest recognition accuracy for the recognition target specified by the user based on the configuration control data stored in the configuration control data storage unit 8. A selection is made (step S4). When the recognition accuracy level is specified, the recognition unit 1 with the highest recognition speed capable of expecting a recognition accuracy higher than the specified recognition accuracy level is selected for the recognition target specified by the user based on the configuration control data. (Step S
5). Next, based on the configuration control data, an independent dictionary 2 specific to the selected recognition means 1 is selected (step S6),
It instructs the recognition control means 4 to start character recognition processing by using one recognition means alone (step S7).
【0023】構成制御データには、認識手段の単独使用
の場合において各認識手段の各認識対象に対し期待でき
る認識精度と認識速度、及び、単独用辞書2との対応関
係を示す情報が含まれる。認識精度と認識速度の情報
は、各認識対象のテストデータを用いた認識実験に基づ
いて予め設定される。The configuration control data includes information indicating the recognition accuracy and the recognition speed that can be expected for each recognition target of each recognition means when the recognition means is used independently, and information indicating the correspondence between the recognition means and the single dictionary 2. . Information on the recognition accuracy and the recognition speed is set in advance based on a recognition experiment using test data of each recognition target.
【0024】1つの認識手段の単独使用による文字認識
処理を起動された認識制御手段4においては、システム
制御手段5により選定された認識手段1と選定された単
独用辞書2を使用して、外部より取り込んだ文字イメー
ジデータの文字認識処理を行わせ、認識結果を外部に出
力する。In the recognition control means 4 which has started the character recognition processing by using one recognition means alone, the recognition means 1 selected by the system control means 5 and the single dictionary 2 selected are used to execute external recognition. The character recognition processing of the fetched character image data is performed, and the recognition result is output to the outside.
【0025】次に、ユーザにより認識精度優先が指示さ
れた場合について説明する。認識精度優先の場合、2つ
(一般的には2つ以上)の認識手段の統合使用となる。
システム制御手段5において、統合使用する認識手段の
選択のために、まずユーザにより認識速度レベルが指示
されたか調べる(ステップS8)。認識速度レベルが指
示されていないときには、構成制御データに基づいて、
ユーザにより指示された認識対象に対し最も高い認識精
度を期待できる2つの認識手段1の組合せを選定する
(ステップS9)。認識速度レベルが指示されていると
きには、構成制御データに基づいて、ユーザに指示され
た認識対象に対し、指示された認識速度レベル以上の認
識速度を期待できる最も認識精度の高い2つの認識手段
1の組合せを選定する(ステップS10)。次に、構成
制御データを参照し、選択した2つの認識手段1の中
で、指定された認識対象に対し単独使用時の認識精度の
高い方の認識手段(一般的には2つ以上の認識手段中で
最も認識精度の高いもの)を主たる認識手段とし、その
固有の単独用辞書2を選定する(ステップS11)。次
に、構成制御データを参照し、他方の認識手段(一般的
には主たる認識手段を除いた残りの各認識手段)を従た
る認識手段として、その主たる認識手段との統合使用の
ための統合用辞書3を選定する(ステップS12)。そ
して、2つの認識手段の統合使用による文字認識処理の
開始を認識制御手段4に指示する(ステップS13)。Next, a case where the user gives an instruction to give priority to recognition accuracy will be described. In the case of giving priority to the recognition accuracy, two (generally two or more) recognition means are integratedly used.
In the system control means 5, first, it is checked whether or not a recognition speed level has been instructed by the user in order to select a recognition means to be integratedly used (step S8). When the recognition speed level is not indicated, based on the configuration control data,
A combination of the two recognizing means 1 that can expect the highest recognition accuracy for the recognition target specified by the user is selected (step S9). When the recognition speed level is instructed, two recognition units 1 with the highest recognition accuracy that can expect a recognition speed equal to or higher than the instructed recognition speed level for the recognition target instructed by the user based on the configuration control data. Is selected (step S10). Next, referring to the configuration control data, of the two recognition means 1 selected, the recognition means having the higher recognition accuracy when the specified recognition target is used alone (generally, two or more recognition means 1). The one having the highest recognition accuracy among the means) is set as the main recognition means, and its unique single dictionary 2 is selected (step S11). Next, referring to the configuration control data, the other recognition means (generally, each of the remaining recognition means excluding the main recognition means) is used as a subordinate recognition means for integration with the main recognition means for integrated use. The dictionary 3 is selected (step S12). Then, it instructs the recognition control means 4 to start the character recognition processing by the integrated use of the two recognition means (step S13).
【0026】構成制御データには、2つの認識手段の統
合使用の場合において、各認識手段の組合せ毎に、主た
る認識手段と従たる認識手段の区別、各認識対象に対し
期待できる認識精度と認識速度、及び、使用する統合用
辞書との対応関係を示す情報が含まれる。これも予めテ
ストデータを用いた認識実験に基づいて設定される。In the configuration control data, in the case of using two recognition means in an integrated manner, for each combination of the recognition means, a distinction is made between the main recognition means and the subordinate recognition means, and the recognition accuracy and recognition expected for each recognition object. Information indicating the speed and the correspondence with the integration dictionary to be used is included. This is also set in advance based on a recognition experiment using test data.
【0027】統合使用による文字認識処理を起動された
認識制御手段4においては、選定された主たる認識手段
1と選定された単独用辞書2を用いて文字イメージデー
タの文字認識を行わせ、また従たる認識手段1と選定さ
れた統合用辞書3を用いて同じ文字イメージデータの文
字認識を行わせ、それぞれの認識結果の統合処理を行
い、統合後の認識結果を外部に出力する。なお、統合処
理は公知の様々な手法によってもよいし、本出願人の特
願平9−195444号の明細書に述べられているよう
な、入力文字イメージと辞書との距離をも利用する、よ
り高性能な統合手法によってもよい。In the recognition control means 4 which has started the character recognition processing by integrated use, the character recognition of the character image data is performed by using the selected main recognition means 1 and the selected single dictionary 2, Character recognition of the same character image data is performed by using the barrel recognition means 1 and the selected integration dictionary 3, the respective recognition results are integrated, and the integrated recognition result is output to the outside. In addition, the integration process may be performed by various known methods, and also uses the distance between the input character image and the dictionary as described in the specification of Japanese Patent Application No. 9-195444 of the present applicant. A higher performance integration method may be used.
【0028】次に、ユーザにより統合用辞書の作成又は
更新動作が指示された場合について説明する。この場
合、システム制御手段5においては、ユーザにより指定
された主たる認識手段1とその固有の単独用辞書2を選
定し(ステップS14)、認識制御手段4に対し、その
主たる認識手段1の単独使用によるテスト用文字イメー
ジデータの認識処理の開始を指示し、また統合用辞書作
成・更新手段6に対しデータサンプル収集の開始を指示
する(ステップS15)。認識制御手段4は、ユーザよ
り指定された認識対象のためのテスト用文字イメージデ
ータを取り込み(例えば図2の補助記憶装置102から
読み込み)、指定された主たる認識手段1と選定された
単独用辞書2を用い文字認識を行わせる。統合用辞書作
成・更新手段6は、文字認識結果が誤認又は認識拒否
(認識できない)となった文字イメージデータを認識制
御手段4を経由して収集データ記憶手段7に記憶させ
る。このようにして、主たる認識手段が誤認したか認識
できなかった文字イメージデータのサンプルが収集され
る。Next, a case where the user instructs the operation of creating or updating the integration dictionary will be described. In this case, the system control means 5 selects the main recognition means 1 designated by the user and its own single dictionary 2 (step S14), and instructs the recognition control means 4 to use the main recognition means 1 alone. Instructs the start of the test character image data recognizing process, and instructs the integration dictionary creating / updating means 6 to start collecting data samples (step S15). The recognition control unit 4 captures test character image data for the recognition target specified by the user (for example, reads from the auxiliary storage device 102 in FIG. 2), and specifies the designated main recognition unit 1 and the selected single dictionary. 2 to perform character recognition. The integration dictionary creating / updating unit 6 causes the collected data storage unit 7 to store the character image data whose character recognition result is erroneously recognized or rejected (unrecognizable) via the recognition control unit 4. In this way, a sample of character image data that the main recognition means misrecognized or could not recognize is collected.
【0029】これが終了すると、システム制御手段5
は、ユーザにより指定された従たる認識手段と、その主
たる認識手段との統合使用のための統合用辞書3を選定
し(ステップS16)、統合用辞書の作成又は更新動作
を統合用辞書作成・更新手段6に指示する(ステップS
17)。統合用辞書作成・更新手段6は、収集データ記
憶手段7に収集された文字イメージデータに基づいて該
当する統合用辞書3の作成又は更新を行う。When this is completed, the system control means 5
Selects the integration dictionary 3 for integrated use of the secondary recognition means specified by the user and the main recognition means (step S16), and performs the operation of creating or updating the integration dictionary by creating or updating the integration dictionary. Instruct update means 6 (step S
17). The integration dictionary creating / updating unit 6 creates or updates the corresponding integration dictionary 3 based on the character image data collected in the collected data storage unit 7.
【0030】統合用辞書の作成を指示された場合、統合
用辞書作成・更新手段6は、例えば、収集された文字イ
メージデータを順に認識制御手段4に入力し、認識制御
手段4において、指定された従たる認識手段1により文
字イメージデータの特徴量を抽出させ、この特徴量を用
いて選定された統合用辞書3を作成する。統合用辞書の
更新を指示された場合、統合用辞書作成・更新手段6
は、例えば、収集された文字イメージデータを順に認識
制御手段4に入力し、認識制御手段4において、指定さ
れた従たる認識手段と選定された統合用辞書3を使用し
て文字認識を行わせ、認識結果が誤認又は認識拒否とな
った文字イメージデータに関して抽出された特徴量をそ
のまま、あるいは統計処理してから当該統合用辞書3に
追加登録し、あるいは、その特徴量によって当該統合用
辞書3の内容を修正する。かくして、ユーザ側で、必要
に応じて、主たる認識手段の弱点を効果的に補強するた
めの統合用辞書の作成又は更新を行うことができる。When instructed to create an integration dictionary, the integration dictionary creating / updating means 6 sequentially inputs the collected character image data to the recognition control means 4, for example. The characteristic amount of the character image data is extracted by the secondary recognizing means 1, and the selected integration dictionary 3 is created using the characteristic amount. When an update of the integration dictionary is instructed, the integration dictionary creation / update means 6
For example, inputting the collected character image data to the recognition control means 4 in order, and causing the recognition control means 4 to perform character recognition using the designated secondary recognition means and the selected integration dictionary 3. The feature amount extracted for the character image data whose recognition result is erroneously recognized or rejected is registered as it is or after statistical processing, and is additionally registered in the integration dictionary 3. Modify the contents of Thus, the user can create or update the integration dictionary for effectively reinforcing the weaknesses of the main recognition means as needed.
【0031】なお、単独用辞書2の作成又は更新のため
の手段を文字認識装置に追加してもよい。Incidentally, means for creating or updating the independent dictionary 2 may be added to the character recognition device.
【0032】[0032]
【発明の効果】請求項1記載の発明の文字認識装置は、
選択された2つ以上の認識手段を統合使用する場合に、
その主たる認識手段の弱点、すなわち認識できなかった
り誤認する文字イメージデータを従たる認識手段で認識
可能にするための辞書を、その従たる認識手段の主たる
認識手段との統合使用のための辞書(統合用辞書)とし
て用意することにより、主たる認識手段の総合的な認識
性能を悪化させる恐れのある、主たる認識手段の固有辞
書(単独用辞書)の改変を行うことなく、主たる認識手
段の弱点を効果的に補完し、全体として認識精度を向上
させることができる。また、従たる認識手段に用いられ
る辞書は固定されるものではなく、従たる認識手段と主
たる認識手段との組合せに対応して選ばれるため、認識
環境に応じて認識手段を様々な組合せで統合使用して
も、主たる認識手段の弱点を効果的に補完し高い認識精
度を達成できる。According to the first aspect of the present invention, there is provided a character recognition apparatus comprising:
If you use two or more selected recognition means,
The dictionary for making the weakness of the main recognition means, that is, the character image data which cannot be recognized or misrecognized, recognizable by the main recognition means is a dictionary for integrated use of the main recognition means of the main recognition means ( By preparing as an integrated dictionary, the weakness of the main recognition means can be reduced without modifying the unique dictionary (single dictionary) of the main recognition means, which may deteriorate the overall recognition performance of the main recognition means. It is possible to complement effectively and improve recognition accuracy as a whole. In addition, the dictionary used for the secondary recognition means is not fixed, but is selected according to the combination of the secondary recognition means and the main recognition means, so that the recognition means are integrated in various combinations according to the recognition environment. Even if used, the weaknesses of the main recognition means can be effectively supplemented to achieve high recognition accuracy.
【0033】請求項2記載の発明の文字認識装置は、ユ
ーザ側で、認識環境の変化などに応じて、必要な認識手
段の組合せの統合使用において主たる認識手段の弱点を
効果的に補完するための辞書の作成又は更新を行い、認
識精度を向上させ、あるいは高い認識精度を維持するこ
とができる。The character recognition apparatus according to the second aspect of the present invention is intended to effectively supplement the weakness of the main recognition means in the integrated use of a necessary combination of recognition means in response to a change in the recognition environment on the user side. The dictionary can be created or updated to improve recognition accuracy or maintain high recognition accuracy.
【0034】請求項3記載の発明の文字認識装置は、認
識速度が重要な場合には認識速度優先を指示することに
より、1つの認識手段の単独使用による高速の文字認識
を行わせることができ、また、認識精度が重要な場合に
は認識精度優先を指示することにより、2つ以上の認識
手段の統合使用による高精度の文字認識を行わせること
ができる。The character recognition device according to the third aspect of the present invention can perform high-speed character recognition by using one recognition unit independently by giving an instruction to prioritize the recognition speed when the recognition speed is important. When recognition accuracy is important, by giving priority to recognition accuracy, high-precision character recognition can be performed by the integrated use of two or more recognition means.
【0035】請求項4記載の発明の文字認識装置は、処
理したい認識対象を指示することにより、その認識対象
に最適な認識手段の単独使用又は統合使用による文字認
識を行わせることができるため、様々な認識対象に対し
性能を最大限に発揮させることができる。The character recognition apparatus according to the fourth aspect of the present invention can specify a recognition target to be processed, and can perform character recognition by use of the optimum recognition means for the recognition target alone or in combination. Performance can be maximized for various recognition targets.
【0036】請求項5記載の発明の文字認識装置は、認
識速度が最重要の場合には、処理したい認識対象に対し
可能な最高速の文字認識を行わせることができ、認識速
度も重要であるが、あるレベル以上の認識精度を必要と
する場合には、処理したい認識対象に対し、そのレベル
以上の認識精度を維持可能な最も高速の文字認識を行わ
せることができる。The character recognition apparatus according to the fifth aspect of the present invention can perform the fastest possible character recognition for a recognition target to be processed when the recognition speed is the most important, and the recognition speed is also important. However, if recognition accuracy of a certain level or more is required, the recognition target to be processed can be made to perform the fastest character recognition that can maintain the recognition accuracy of that level or more.
【0037】請求項6記載の発明の文字認識装置は、認
識精度が最重要の場合には、処理したい認識対象に対し
可能な最高精度の文字認識を行わせることができ、認識
精度も重要であるが、あるレベル以上の認識速度を必要
とする場合には、処理したい認識対象に対し、そのレベ
ル以上の認識速度を維持可能な最も高精度の文字認識を
行わせることができる。In the character recognition device according to the present invention, when the recognition accuracy is the most important, the recognition target to be processed can be subjected to the highest possible character recognition, and the recognition accuracy is also important. However, when a recognition speed higher than a certain level is required, the recognition target to be processed can be made to perform the highest-accuracy character recognition capable of maintaining the recognition speed higher than that level.
【図1】本発明の文字認識装置の一実施例を示すブロッ
ク図である。FIG. 1 is a block diagram showing one embodiment of a character recognition device of the present invention.
【図2】図1の文字認識装置をコンピュータ上でソフト
ウエアによって実現する例を示すブロック図である。FIG. 2 is a block diagram showing an example in which the character recognition device of FIG. 1 is realized by software on a computer.
【図3】システム制御手段の制御フローの一部を示すフ
ローチャートである。FIG. 3 is a flowchart showing a part of a control flow of a system control unit.
【図4】システム制御手段の制御フローの一部を示すフ
ローチャートである。FIG. 4 is a flowchart showing a part of a control flow of a system control unit.
【図5】システム制御手段の制御フローの一部を示すフ
ローチャートである。FIG. 5 is a flowchart showing a part of a control flow of a system control unit.
1 認識手段 2 単独用辞書 3 統合用辞書 4 認識制御手段 5 システム制御手段 6 統合用辞書作成・更新手段 7 収集データ記憶手段 8 構成制御データ記憶手段 9 指示入力手段 100 CPU 101 メモリ 102 補助記憶装置 104 入力インターフェイス 105 出力装置 P1 認識プログラム P4 認識制御プログラム P5 システム制御プログラム P6 統合用辞書作成・更新プログラム REFERENCE SIGNS LIST 1 recognition means 2 independent dictionary 3 integration dictionary 4 recognition control means 5 system control means 6 integration dictionary creation / update means 7 collected data storage means 8 configuration control data storage means 9 instruction input means 100 CPU 101 memory 102 auxiliary storage device 104 input interface 105 output device P1 recognition program P4 recognition control program P5 system control program P6 dictionary for creating and updating integration
Claims (6)
手段を選択し統合使用が可能な文字認識装置であって、
各認識手段は、それに固有の辞書のほかに、他の認識手
段との統合使用のための辞書を有し、2つ以上の認識手
段が統合使用される場合に、それら2つ以上の認識手段
中の主たる認識手段はそれに固有の辞書を使用し、他の
従たる認識手段は、それと主たる認識手段との統合使用
のための辞書を使用することを特徴とする文字認識装
置。1. A character recognition device having a plurality of recognition means and capable of selecting two or more recognition means and using them in an integrated manner,
Each recognizing means has, in addition to its own dictionary, a dictionary for integrated use with other recognizing means, and when two or more recognizing means are used integrally, the two or more recognizing means are used. A character recognition apparatus, wherein the main recognition means uses a dictionary specific to the main recognition means, and the other sub-recognition means uses a dictionary for integrated use with the main recognition means.
主たる認識手段によって誤認され又は認識されないデー
タサンプルを収集する手段と、収集されたデータサンプ
ルを利用して、それら2つ以上の認識手段中の従たる認
識手段の、主たる認識手段との統合使用のための辞書を
作成又は更新する手段とを具備することを特徴とする請
求項1記載の文字認識装置。2. A means for collecting data samples that are misrecognized or not recognized by a main one of the two or more recognition means used in an integrated manner, and the two or more recognition means utilizing the collected data samples. 2. A character recognition apparatus according to claim 1, further comprising means for creating or updating a dictionary for integrated use of the secondary recognition means in the means with the primary recognition means.
それぞれに固有の複数の単独用辞書と、該複数の認識手
段のそれぞれの他の認識手段との統合使用のための複数
の統合用辞書と、認識速度の優先又は認識精度の優先を
指示するための手段と、認識速度の優先が指示された場
合に選択した1つの認識手段の単独使用により文字認識
を行わせる手段と、認識精度の優先が指示された場合に
選択した2つ以上の認識手段の統合使用により文字認識
を行わせる手段と、1つの認識手段の単独使用による文
字認識の場合に当該認識手段が用いる辞書として当該認
識手段に固有の単独用辞書を選択する手段と、2つ以上
の認識手段の統合使用による文字認識の場合に、当該2
つ以上の認識手段中の1つの主たる認識手段が用いる辞
書として当該主たる認識手段に固有の単独用辞書を選択
し、他の従たる各認識手段が用いる辞書として、当該従
たる各認識手段の当該主たる認識手段との統合使用のた
めの統合用辞書を選択する手段とを具備することを特徴
とする文字認識装置。3. A plurality of recognition means, a plurality of independent dictionaries specific to each of the plurality of recognition means, and a plurality of integrations for integrated use of each of the plurality of recognition means with each other recognition means. Means for instructing priority of recognition speed or recognition accuracy, means for performing character recognition by solely using one recognition means selected when priority of recognition speed is instructed, A means for performing character recognition by the integrated use of two or more recognition means selected when priority of accuracy is instructed, and a dictionary used by the recognition means for character recognition by single use of one recognition means. In the case of character recognition by means of selecting an independent dictionary specific to the recognition means and the integrated use of two or more recognition means,
A single dictionary unique to the main recognition means is selected as a dictionary used by one main recognition means of the one or more recognition means, and a dictionary used by each of the sub recognition means is selected as a dictionary used by the other sub recognition means. Means for selecting an integration dictionary for integrated use with a main recognition means.
指示された認識対象に応じて単独使用又は統合使用され
る認識手段が選択されることを特徴とする請求項3記載
の文字認識装置。4. It has a means for indicating a recognition target,
4. The character recognition device according to claim 3, wherein a recognition unit used alone or integrated is selected according to the specified recognition target.
精度レベルを指示するための手段とを有し、認識速度の
優先が指示された場合において、認識精度レベルが指示
されたときには指示された認識対象に対し指示された認
識精度レベルを満足する認識手段中で最も認識速度の速
い認識手段が選択され、認識精度レベルが指示されない
ときには指示された認識対象に対し認識精度が最も高い
認識手段が選択されることを特徴とする請求項3記載の
文字認識装置。5. A device for instructing a recognition target and a means for instructing a recognition accuracy level, wherein when priority is given to the recognition speed, an instruction is given when the recognition accuracy level is instructed. The recognition means with the highest recognition speed is selected from among the recognition means that satisfies the specified recognition accuracy level for the recognized recognition object, and the recognition means with the highest recognition accuracy for the specified recognition target when the recognition accuracy level is not specified. The character recognition device according to claim 3, wherein is selected.
速度レベルを指示するための手段とを有し、認識精度の
優先が指示された場合において、認識速度レベルが指示
されたときには指示された認識対象に対し指示された認
識速度レベルを満足する認識手段中で最も認識精度が高
い認識手段の組合せが選択され、認識速度レベルが指示
されないときには指示された認識対象に対し認識精度が
最も高い認識手段の組合せが選択されることを特徴とす
る請求項3記載の文字認識装置。6. A device for instructing a recognition target and a means for instructing a recognition speed level, wherein when priority is given to recognition accuracy, an instruction is given when the recognition speed level is instructed. The combination of the recognition means with the highest recognition accuracy among the recognition means satisfying the specified recognition speed level for the recognized recognition target is selected, and when the recognition speed level is not specified, the recognition accuracy for the specified recognition target is the highest. 4. The character recognition device according to claim 3, wherein a combination of recognition means is selected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04315398A JP3771369B2 (en) | 1998-02-25 | 1998-02-25 | Character recognition device and character recognition processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04315398A JP3771369B2 (en) | 1998-02-25 | 1998-02-25 | Character recognition device and character recognition processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11242718A true JPH11242718A (en) | 1999-09-07 |
JP3771369B2 JP3771369B2 (en) | 2006-04-26 |
Family
ID=12655915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04315398A Expired - Fee Related JP3771369B2 (en) | 1998-02-25 | 1998-02-25 | Character recognition device and character recognition processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3771369B2 (en) |
-
1998
- 1998-02-25 JP JP04315398A patent/JP3771369B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3771369B2 (en) | 2006-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH11242718A (en) | Character recognizing device | |
JPH09198404A (en) | Method and device for processing document | |
JPH05233716A (en) | Automatic attribute judgement system | |
JPH0619962A (en) | Text dividing device | |
JPH0991311A (en) | Information storage and retrieval device and its control method | |
JPH05181633A (en) | Alignment condition and/or retrieval condition input processing system | |
JP3466761B2 (en) | Document processing apparatus and control method thereof | |
JPH10222612A (en) | Document recognizing device | |
JPH11316802A (en) | Word recognition device, its address place name registering method, and recording medium | |
JPH10269244A (en) | Vehicle license number retrieval device | |
JPH096772A (en) | Character processor | |
JPH07129507A (en) | Automatic post processing system | |
JPH02249087A (en) | English word retrieving device | |
JPH0922411A (en) | Document processing method and its device | |
JPH11316792A (en) | Information processor and slip creating method | |
JPH11203400A (en) | Character inputting device and method therefor, and machine readable recording medium for recording program for allowing computer to execute the same method | |
JPH05298489A (en) | System for recognizing character | |
JPH103518A (en) | Method for recognizing character and recording medium and device for recognizing character | |
JPH11143993A (en) | Recognized character correction device and its method | |
JPH03156678A (en) | Document editing device | |
JPH11282841A (en) | Language analysis device and computer readable recording medium recording language analysis program | |
JPH0338745A (en) | Data batch processing system | |
JPH07152877A (en) | English alphabet recognition device | |
JPH08287046A (en) | Information processor | |
JPH10124616A (en) | Character recognizing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100217 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110217 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120217 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140217 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |