JPH09204490A - Method for selecting character string input means - Google Patents

Method for selecting character string input means

Info

Publication number
JPH09204490A
JPH09204490A JP8009704A JP970496A JPH09204490A JP H09204490 A JPH09204490 A JP H09204490A JP 8009704 A JP8009704 A JP 8009704A JP 970496 A JP970496 A JP 970496A JP H09204490 A JPH09204490 A JP H09204490A
Authority
JP
Japan
Prior art keywords
character recognition
estimation
recognition accuracy
result
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8009704A
Other languages
Japanese (ja)
Inventor
Sueki Matsumura
季樹 松村
Osamu Nakamura
修 中村
Kimitomo Kobayashi
公知 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8009704A priority Critical patent/JPH09204490A/en
Publication of JPH09204490A publication Critical patent/JPH09204490A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a highly efficient character string input means selecting method for freely incorporating various estimation algorithms without restriction, for improving the reliability of the estimation of character recognition precision and for inputting a character string with maximum efficiency for the quality of various input characters. SOLUTION: Image data 113-117 of the character strings are inputted to plural character recognition precision estimation processing blocks 101-105 and plural character recognition precision estimation processing results 107-111 are derived. The estimation processing results 107-111 are inputted to a character recognition estimation processing result derivation processing block 106 and a single character recognition precision estimation result is derived. In the derived processing block 106, an operator where an operation rule is made to correspond to the derivation logic of the estimation processing block is defined and a rule for designating ID which is previously allocated for the individual character recognition precision estimation result and a processing is provided as the factor of the operator. Then, a derivation processing is executed based on an operation expression mentioned based on the rule.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識技術を用
いて日本語文字列等を計算機システム等に入力する処理
技術に関し、特に文字認識処理を行った後に、任意個数
の文字認識精度推定処理を自由に組み込んだり、それら
の認識精度推定処理を任意の順序で行ったりすること
で、複数個の認識精度推定結果を任意の手法で導出し、
その認識精度推定結果を用いて効率のよい文字列入力手
段を選択可能にする処理技術に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a processing technique for inputting a Japanese character string or the like into a computer system or the like using a character recognition technique, and more particularly, to an arbitrary number of character recognition accuracy estimation processes after performing the character recognition process. Can be freely incorporated or their recognition accuracy estimation processing can be performed in an arbitrary order to derive a plurality of recognition accuracy estimation results by an arbitrary method,
The present invention relates to a processing technique that enables selection of an efficient character string input means using the recognition accuracy estimation result.

【0002】[0002]

【従来の技術】文字認識技術は、人手による文字入力稼
働を削減する点で有用な技術と認識されており、長年の
研究開発に伴い、実用的な技術として次第に普及しつつ
ある。しかし、手書き文字を対象とする場合、ていねい
に書かれた文字から、劣悪な文字まで、様々な認識精度
(品質)の文字すべてに対して高精度な文字認識を行う
ことは困難である。文字の認識精度(品質)が悪い場合
には認識誤りが多くなり、キーボード等による手作業で
の文字列入力方法よりも効率の悪い修正作業を強いる結
果となってしまう。
2. Description of the Related Art Character recognition technology is recognized as a useful technology for reducing the number of manual character input operations, and is gradually spreading as a practical technology due to many years of research and development. However, when targeting handwritten characters, it is difficult to perform highly accurate character recognition for all characters with various recognition accuracies (quality), from carefully written characters to inferior characters. If the character recognition accuracy (quality) is poor, there will be many recognition errors, resulting in a correction work that is less efficient than the manual character string input method using a keyboard or the like.

【0003】そこで、手書き文字の認識精度を推定し、
その認識精度に応じて適切な入力手段を選択し、効率良
く文字列を入力するといった、認識精度推定の課題の解
決が必須条件となる。
Therefore, the recognition accuracy of handwritten characters is estimated,
Solving the problem of recognition accuracy estimation, such as selecting an appropriate input means according to the recognition accuracy and efficiently inputting a character string, is an essential condition.

【0004】従来の認識精度推定では、特定の認識精度
推定アルゴリズムを単独で実行する方法等が採用されて
きた。
In the conventional recognition accuracy estimation, a method of independently executing a specific recognition accuracy estimation algorithm has been adopted.

【0005】[0005]

【発明が解決しようとする課題】上述の文字認識精度推
定アルゴリズムを単独で実行する方法において、例えば
リジェクト判定処理のような認識結果に依存する推定ア
ルゴリズムを用いる場合では、認識結果をほぼそのまま
反映することとなるため、信頼性に欠ける可能性があ
る。また、認識結果に独立な推定アルゴリズムを用いる
場合では、認識結果に左右されない推定結果を出力する
ことが可能であるが、推定結果と認識結果とが大きく異
なる場合には、どちらの結果を採用すべきかが明確でな
いため、認識精度推定を柔軟に行うこと等が困難であっ
た。
In the method for independently executing the character recognition accuracy estimation algorithm described above, when an estimation algorithm that depends on the recognition result, such as a rejection judgment process, is used, the recognition result is reflected almost as it is. Therefore, it may be unreliable. When an estimation algorithm that is independent of the recognition result is used, it is possible to output an estimation result that does not depend on the recognition result. However, if the estimation result and the recognition result differ greatly, which result should be used. Since the key is not clear, it was difficult to flexibly estimate the recognition accuracy.

【0006】本発明は、上記事情を鑑みてなされたもの
で、その目的は、従来の技術における上述のような問題
を解消し、文字認識推定のために認識アルゴリズムに依
存する推定アルゴリズムや認識アルゴリズムに独立な推
定アルゴリズム等を制限なく自由に組み込んで信頼性の
高い単一の文字認識推定結果を導出することが可能な文
字認識精度推定結果導出法を有する精度の高い文字列入
力手段選択方法を提供することにある。
The present invention has been made in view of the above circumstances, and an object thereof is to solve the above-mentioned problems in the conventional art and to rely on a recognition algorithm for character recognition estimation. A highly accurate character string input means selection method having a character recognition accuracy estimation result derivation method capable of deriving a highly reliable single character recognition estimation result by freely incorporating an independent estimation algorithm etc. into To provide.

【0007】[0007]

【課題を解決するための手段】本発明の上述の目的は、
文字イメージデータを文字コードに変換し、文字認識精
度推定結果に基づいて複数の文字列入力手段の中から入
力効率の高いものを選択する文字列入力手段選択方法に
おいて、入力された文字イメージデータについて複数の
文字認識精度推定を行う段階と、前記複数の文字認識精
度推定の推定結果から単一の文字認識精度推定結果を導
出する段階と、前記導出された単一の文字認識推定結果
に基づいて複数の文字列入力手段の中から入力効率の高
いものを選択する段階と、を有することを特徴とする文
字列入力手段選択方法によって達成される。
SUMMARY OF THE INVENTION The above objects of the present invention are as follows.
In the character string input means selection method for converting character image data into a character code and selecting one having a high input efficiency from a plurality of character string input means based on the result of character recognition accuracy estimation, regarding the input character image data Performing a plurality of character recognition accuracy estimation, deriving a single character recognition accuracy estimation result from the plurality of character recognition accuracy estimation results, based on the derived single character recognition estimation result And a step of selecting a character string input means having a high input efficiency from among the plurality of character string input means.

【0008】上記の文字列入力手段選択方法において、
複数の文字認識精度推定結果から単一の文字認識精度推
定結果を導出する段階は、前記導出の過程を演算規則に
対応させた演算子を定義し、それら演算子を用いて構成
された演算式に基づいて前記単一の文字認識精度推定結
果を導出する処理手法および導出していく順序を決定す
る過程を有するものとするのが、複数の文字認識精度推
定結果から単一の文字認識精度推定結果を導出する処理
を容易にする点で好適である。
In the above character string input means selecting method,
The step of deriving a single character recognition accuracy estimation result from a plurality of character recognition accuracy estimation results defines an operator that corresponds the operation of the derivation process to an operation rule, and an arithmetic expression constructed using these operators. Based on the above, a processing method for deriving the single character recognition accuracy estimation result and a process for deciding the order of deriving the single character recognition accuracy estimation result have a single character recognition accuracy estimation from a plurality of character recognition accuracy estimation results. This is preferable because it facilitates the process of deriving the result.

【0009】さらに、上記の文字列入力手段選択方法に
おいて、演算子を用いて構成された演算式に基づいて単
一の文字認識精度推定結果を導出する処理手法および導
出していく順序を決定する過程は、利用者が記述した演
算子の並びにより単一の文字認識精度推定結果を導出す
る順序を決定する過程と、予め演算子に対応づけられた
導出処理の種類を決定する過程と、利用者が演算子の引
数として記述した文字認識精度推定結果のIDナンバ、
または文字認識精度推定処理のIDナンバを基に、処理
の対象とする文字認識精度推定結果や推定処理を決定す
る過程と、を有するものとするのが、演算子を用いて構
成された演算式に基づいて単一の文字認識精度推定結果
を導出する手法および導出していく順序を決定する処理
を容易にする点で好適である。
Further, in the above-mentioned character string input means selecting method, a processing method for deriving a single character recognition accuracy estimation result and an deriving order are determined based on an arithmetic expression formed by using operators. The process is a process of deciding the order of deriving a single character recognition accuracy estimation result of the operator described by the user, a process of deciding the type of derivation process associated with the operator in advance, and a process of using ID number of the character recognition accuracy estimation result described by the operator as an argument of the operator,
Alternatively, an arithmetic expression formed by using an operator has a process of determining a character recognition accuracy estimation result or an estimation process to be processed based on an ID number of the character recognition accuracy estimation process. This is preferable because it facilitates the method of deriving a single character recognition accuracy estimation result based on the above, and the process of determining the deriving order.

【0010】本発明に係わる文字認識精度推定結果の導
出法においては、入力された文字イメージデータについ
て複数の文字認識精度推定を行い、その複数の文字認識
精度推定結果から単一の文字認識精度推定結果を導出す
る導出法を採用する。このような導出処理を容易にする
ため、具体的には、個々の文字認識精度推定処理結果を
導出するために用意された複数のロジックに対して、そ
れぞれの導出ロジックに演算規則を対応させた演算子を
定義し、その演算子の引数として、個々の文字認識精度
推定結果および処理に対して予め割り当ててあるIDを
指定するという規則を設け、この規則に基づいて導出法
を演算式で記述することにより導出処理を行う。このよ
うな導出法を採用することで、文字認識精度の推定を行
う処理(アルゴリズム)を自由に組み込んで柔軟に導出
可能とし、手書き文字にどのような品質の字種が含まれ
ていても、また、入力される字種の認識精度に偏りがあ
るような場合であっても、最適化された導出法を構成可
能として、文字認識精度推定処理の信頼性を向上させ、
文字認識精度によって最も効率の良い文字列入力手段を
選択する帳票入力方法等を高い精度で実現する。
In the method of deriving a character recognition accuracy estimation result according to the present invention, a plurality of character recognition accuracy estimations are performed on input character image data, and a single character recognition accuracy estimation is performed from the plurality of character recognition accuracy estimation results. The derivation method that derives the result is adopted. In order to facilitate such derivation processing, specifically, a plurality of logics prepared for deriving individual character recognition accuracy estimation processing results are associated with calculation rules for the respective derivation logics. A rule is defined in which an operator is defined, and an ID assigned in advance to each character recognition accuracy estimation result and processing is specified as an argument of the operator, and the derivation method is described by an arithmetic expression based on this rule. By doing so, the derivation process is performed. By adopting such a derivation method, it is possible to flexibly derive by freely incorporating the process (algorithm) for estimating the character recognition accuracy, and no matter what quality character type is included in the handwritten character, Even if the recognition accuracy of the input character type is biased, an optimized derivation method can be configured to improve the reliability of the character recognition accuracy estimation process,
A form input method or the like for selecting the most efficient character string input means depending on the character recognition accuracy is realized with high accuracy.

【0011】[0011]

【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を詳しく説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings.

【0012】図1は、本発明の一実施形態例に係わる認
識精度推定結果導出法を含む構成図である。図1におい
て、101から105までは文字認識精度の推定処理を
行うn個のブロックである。これらの文字認識精度推定
処理ブロック101〜105では、文字認識の結果が正
しいかどうかを推定する処理を行い、その処理として、
文字認識結果を利用した依存型の推定処理でも、認識結
果を一切用いない独立型の推定処理でも任意に組み込み
可能である。さらに、実現可能ならば異なる推定処理を
いくつ用意しても構わず、また、認識精度として文字認
識率や正解文字候補包含率や他の尺度を用いることが可
能であり、推定処理の種類数や認識精度を表す尺度は、
本発明の趣旨を損なわない範囲で任意である。
FIG. 1 is a block diagram including a recognition accuracy estimation result derivation method according to an embodiment of the present invention. In FIG. 1, 101 to 105 are n blocks for performing character recognition accuracy estimation processing. These character recognition accuracy estimation processing blocks 101 to 105 perform processing for estimating whether or not the result of character recognition is correct.
It is possible to arbitrarily incorporate either a dependent estimation process using a character recognition result or a stand-alone estimation process using no recognition result. Further, if it is feasible, any number of different estimation processes may be prepared, and the character recognition rate, the correct character candidate inclusion rate, and other measures can be used as the recognition accuracy, and the number of types of estimation processing and The scale of recognition accuracy is
It is optional as long as the gist of the present invention is not impaired.

【0013】これらの文字認識精度推定処理ブロック1
01〜105は、113から117で表される文字列の
イメージデータについての前処理の結果データの入力に
基づいて認識精度推定処理が行われる。これらの入力1
13〜117は、文字認識処理等、認識精度推定処理の
前処理として行われた結果データであり、本発明の趣旨
とは無関係である。認識精度推定処理ブロック101か
ら105によって推定されたそれぞれの推定結果データ
107〜111は、文字認識精度推定結果導出処理ブロ
ック106へ出力される。
These character recognition accuracy estimation processing block 1
For 01 to 105, the recognition accuracy estimation process is performed based on the input of the result data of the preprocessing for the image data of the character strings represented by 113 to 117. These inputs 1
Numerals 13 to 117 are result data performed as a pre-process of the recognition accuracy estimation process such as the character recognition process and have no relation to the gist of the present invention. The estimation result data 107 to 111 estimated by the recognition accuracy estimation processing blocks 101 to 105 are output to the character recognition accuracy estimation result derivation processing block 106.

【0014】文字認識精度推定結果導出処理ブロック1
06では、予め、文字認識精度推定結果導出法記述ファ
イル等から文字認識精度推定結果導出法記述データ11
2を読み込んでおき、その記述に従い、様々な導出ロジ
ックを用いて文字認識精度推定結果の導出処理を行い、
複数の文字認識精度推定結果から、最終的に一つの文字
認識精度推定結果を出力する。
Character recognition accuracy estimation result derivation processing block 1
In 06, the character recognition accuracy estimation result derivation method description data 11 is stored in advance from the character recognition accuracy estimation result derivation method description file or the like.
2 is read, and the derivation process of the character recognition accuracy estimation result is performed using various derivation logics according to the description.
Finally, one character recognition accuracy estimation result is output from the plurality of character recognition accuracy estimation results.

【0015】尚、文字認識精度推定結果導出処理ブロッ
ク106では、導出処理のみを行うのではなく、実際に
は個々の文字認識精度推定処理を行うことが可能であ
る。そのような指定法についての実施形態例は、図3を
用いて説明する。また、文字認識精度推定結果導出法の
指定をファイルを用いて行ったが、キーボードから直接
入力する方法を用いても構わず、導出法の指定を入力す
る手段は本発明の趣旨を損なわない範囲で任意である。
The character recognition accuracy estimation result derivation processing block 106 can actually perform not only the derivation processing but also the individual character recognition accuracy estimation processing. An exemplary embodiment of such a designation method will be described with reference to FIG. Further, although the specification of the character recognition accuracy estimation result derivation method is performed using a file, a method of directly inputting from the keyboard may be used, and the means for inputting the derivation method specification does not impair the gist of the present invention. Is optional.

【0016】次に、図1に示す実施形態例の文字認識精
度推定結果導出処理ブロッック106の処理の流れを図
2を用いて説明する。
Next, the flow of processing of the character recognition accuracy estimation result derivation processing block 106 of the embodiment shown in FIG. 1 will be described with reference to FIG.

【0017】まず、処理ブロック201において、図1
の107から111で示される個々の文字認識精度推定
結果データを読み込む入力処理を行う。次に、処理ブロ
ック202において、文字認識精度推定結果導出法記述
ファイル等から導出法の規則を表す記述を入力する。次
に、処理ブロック203において、処理ブロック202
で入力された記述から導出法の規則(導出順序、導出処
理法など)を解釈して決定する。次に、処理ブロック2
04において、処理ブロック203の導出法の指定を基
に、個々の文字認識精度推定結果を導出する。この処理
ブロック204での導出処理では、個々の推定結果を導
出するだけでなく、場合によっては図1の推定処理ブロ
ック101から105で行わなかった文字認識精度推定
処理を行うこともある。図1の推定処理ブロック101
から105で行った文字認識精度推定処理を再度行うこ
とも可能である。次に、処理ブロック205において、
処理ブロック204の処理がすべて終了したかどうかを
判定し、終了するまでは処理ブロック204へ戻してそ
の処理を繰り返すようにする。最後に、処理ブロック2
05において処理ブロック204の処理がすべて終了し
たと判定された場合に、処理ブロック206において、
文字認識精度導出推定結果を出力し、終了する。
First, in processing block 201, FIG.
The input processing of reading the individual character recognition accuracy estimation result data indicated by 107 to 111 is performed. Next, in processing block 202, a description representing a derivation method rule is input from a character recognition accuracy estimation result derivation method description file or the like. Next, in processing block 203, processing block 202
The rules of the derivation method (deriving order, derivation processing method, etc.) are interpreted and determined from the description input in. Next, processing block 2
In 04, the individual character recognition accuracy estimation result is derived based on the designation of the derivation method of the processing block 203. In the derivation process in the processing block 204, not only the individual estimation result is derived, but also the character recognition accuracy estimation process which is not performed in the estimation process blocks 101 to 105 in FIG. 1 may be performed in some cases. Estimation processing block 101 of FIG.
It is also possible to re-execute the character recognition accuracy estimation processing performed in steps 105 to 105. Next, in processing block 205,
It is determined whether or not all the processing of the processing block 204 has been completed, and the processing is returned to the processing block 204 and repeated until it is completed. Finally, processing block 2
If it is determined at 05 that all the processing of the processing block 204 has ended, at processing block 206,
The character recognition accuracy derivation estimation result is output, and the processing ends.

【0018】図3は、図2に示す実施形態例の文字認識
精度推定結果を導出するブロック204の説明図であ
る。この図では、文字認識精度推定結果導出法記述ファ
イル等から導出法の規則を入力する処理を省略してあ
る。
FIG. 3 is an explanatory diagram of the block 204 for deriving the character recognition accuracy estimation result of the embodiment shown in FIG. In this figure, the process of inputting the rule of the derivation method from the character recognition accuracy estimation result derivation method description file or the like is omitted.

【0019】図3において、305から309は、図1
の107から111に示される個々の文字認識精度推定
結果であり、言い換えれば、文字認識の結果が正しいか
どうかを推定した結果である。301から304は、導
出処理を表すブロックである。図3に示す実施形態例で
は、四つの導出処理について説明する。
In FIG. 3, reference numerals 305 to 309 denote those in FIG.
Nos. 107 to 111 are the estimation results of the individual character recognition accuracy, in other words, the estimation results of whether the character recognition result is correct. Reference numerals 301 to 304 are blocks representing derivation processing. In the embodiment example shown in FIG. 3, four derivation processes will be described.

【0020】301の導出処理は、多数決を表す。すな
わち、複数の推定結果の中で、文字認識結果が正しいと
推定された結果が別途指定した閾値を越えていれば、正
しく認識されていると推定した結果であるとして導出
し、その閾値を越えていなければ、正しく認識されてい
ないと推定した結果であるとして導出する導出法であ
る。文字認識結果が正しいと推定された結果の個数がい
くつを越えればよいかという閾値は、本発明の趣旨を変
えない範囲で任意に設定できる。
The derivation process 301 represents a majority vote. In other words, if the character recognition result is estimated to be correct among a plurality of estimation results that exceeds a separately specified threshold value, it is derived as the result that the character recognition result is estimated to be correctly recognized, and the result is exceeded. If it is not, it is a derivation method that derives it as the result of estimating that it is not correctly recognized. The threshold value as to how many results the character recognition result is estimated to be correct can be arbitrarily set within a range not changing the gist of the present invention.

【0021】302の導出処理は、推定対象を限定して
推定処理を行う処理を表す。すなわち、その前の処理で
出力された導出(推定)結果に応じて推定対象を限定
し、図1の推定処理ブロック101から105での推定
処理、あるいは他の推定処理を行う処理である。図1お
よび図2で表される実施形態例の説明で前述したよう
に、処理ブロック204では、導出処理のみ行うのでは
なく、実際には個々の文字認識精度推定処理を行うこと
が可能である。
The derivation process of 302 represents a process of limiting the estimation target and performing the estimation process. That is, the estimation target is limited according to the derivation (estimation) result output in the previous process, and the estimation process in the estimation process blocks 101 to 105 in FIG. 1 or another estimation process is performed. As described above in the description of the exemplary embodiments shown in FIGS. 1 and 2, in the processing block 204, not only the derivation process but also the individual character recognition accuracy estimation process can be actually performed. .

【0022】303の導出処理は、論理積を表す。すな
わち、複数の推定結果の中で、すべての文字認識結果が
正しいと推定された時のみ、正しい認識されていると推
定した結果であるとして導出する。
The derivation process of 303 represents a logical product. That is, only when it is estimated that all the character recognition results are correct among the plurality of estimation results, the result is estimated as the result of the correct recognition.

【0023】304の導出処理は、論理和を表す。すな
わち、複数の推定結果のうち、一つでも正しく認識され
ていると推定された結果が含まれていれば、正しく認識
されていると推定した結果であるとして導出する。
The derivation process of 304 represents a logical sum. That is, if even one of the plurality of estimation results is estimated to be correctly recognized, it is derived as the result of the estimation that it is correctly recognized.

【0024】以上では、処理ブロック301から304
までにて示した四つの導出法(推定処理を含む)に限定
して説明したが、他の導出法(推定処理を含む)も考え
られる。これは、本発明の趣旨を変えない範囲内で拡張
可能である。
In the above, processing blocks 301 to 304
Although the description has been limited to the four derivation methods (including the estimation process) described above, other derivation methods (including the estimation process) are also possible. This can be extended within the scope of the present invention.

【0025】次に、上記の導出の記述法について、例を
あげて説明する。
Next, the description method of the above derivation will be described with an example.

【0026】説明を簡単にするため、305から309
で示される個々の推定結果として、文字認識の結果が正
しいかどうかを1または0の数値で表すこととする。す
なわち、図1の推定処理ブロック101から105にお
いて、文字認識の結果が正しいと推定された場合には
1、文字認識の結果が正しくないと推定された場合には
0をそれぞれ推定結果とすることとする。また、文字認
識処理の結果として、第五位まで正解文字候補を出力し
たとし、それに対応して推定結果を第五位まで出力す
る。左端が第一位、右端が第五位とする。したがって、
一つの文字につき、例えば、“10000”や“011
00”のように五個の1または0の並びが対応づけられ
ることとなる。したがって、本実施形態例として、30
5から309のデータ形式として“10000”や“0
1100”を用いることとする。尚、推定結果の表現方
法として、1/0以外にも様々な表現を用いることが可
能であり、本発明の趣旨を損なわない範囲で任意であ
る。
For simplicity of explanation, 305 to 309
As the individual estimation result indicated by, whether or not the result of character recognition is correct is represented by a numerical value of 1 or 0. That is, in the estimation processing blocks 101 to 105 of FIG. 1, 1 is set as the estimation result when the character recognition result is estimated to be correct, and 0 is set as the estimation result when the character recognition result is estimated to be incorrect. And As the result of the character recognition processing, it is assumed that the correct character candidates are output up to the fifth place, and the estimation result is output up to the fifth place correspondingly. The left end is the first place and the right end is the fifth place. Therefore,
For example, "10000" or "011" for one character
A sequence of five 1s or 0s is associated with each other, such as "00". Therefore, as an example of the present embodiment, 30
The data format from 5 to 309 is "10000" or "0"
1100 ″ is used. As the method of expressing the estimation result, various expressions other than 1/0 can be used, and any expression can be used as long as the gist of the present invention is not impaired.

【0027】ここで、文字認識精度推定処理ブロックか
ら出力された推定結果に固有のIDナンバを割り当て
る。すなわち、推定処理ブロック101から出力された
推定結果305にID=1を、推定処理ブロック102
の推定結果306にID=2を、推定処理ブロック10
3の推定結果307にID=3を、推定処理ブロック1
04の推定結果308にID=4を、推定処理ブロック
105の推定結果309にID=5を、…というように
である。IDナンバは、1から順に割り当てる必要はな
く、また数字以外の記号やアルファベットでもよい。個
々の推定処理結果を区別できる限り任意である。
Here, a unique ID number is assigned to the estimation result output from the character recognition accuracy estimation processing block. That is, ID = 1 is added to the estimation result 305 output from the estimation processing block 101, and the estimation processing block 102
ID = 2 in the estimation result 306 of Eq.
ID = 3 in the estimation result 307 of 3 and the estimation processing block 1
The estimation result 308 of 04 is ID = 4, the estimation result 309 of the estimation processing block 105 is ID = 5, and so on. The ID numbers do not have to be assigned in order from 1 and may be symbols or alphabets other than numbers. It is arbitrary as long as it can distinguish the individual estimation processing results.

【0028】処理ブロック301から304までの導出
処理を行うことを表す規則をそれぞれ、M、R、A、O
で表される演算子記号で表現する。即ち、Mは多数決に
よる導出処理、Rは推定対象の限定による導出処理、A
は論理積による導出処理、Oは論理和による導出処理で
ある。また、どの文字認識精度推定結果を対象とするか
を“[”、“]”で囲まれた引数で表現し、引数はカン
マで区切り、任意個数指定できる。引数には、演算子そ
のものも含めることが可能である。例えば、推定結果
1,2,3を多数決で導出する場合には、“M[1,
2,3]”、推定結果1,2,3を論理和で導出した結
果のうち、文字認識結果が正しいと推定された結果に対
してのみ推定処理4を行う場合は、“R[O[1,2,
3],4]”というように指定する。演算子Rが指定さ
れた場合の引数は、推定処理結果を表すのではなく、推
定処理を表すと解釈する。
Rules representing that the derivation processing of the processing blocks 301 to 304 are performed are M, R, A and O, respectively.
Expressed by the operator symbol represented by. That is, M is a derivation process based on majority decision, R is a derivation process based on limitation of estimation target, and A is
Is a derivation process by a logical product, and O is a derivation process by a logical sum. Further, which character recognition accuracy estimation result is to be targeted is expressed by an argument surrounded by “[” and “]”, and the argument can be separated by commas and an arbitrary number can be designated. The argument can include the operator itself. For example, when deriving the estimation results 1, 2, and 3 by a majority decision, “M [1,
2, 3] ”, and when the estimation process 4 is performed only on the result of deducing the character recognition result out of the results obtained by logically deriving the estimation results 1, 2, and 3,“ R [O [ 1, 2,
3], 4] ”. When the operator R is specified, the argument is interpreted as representing the estimation process, not the estimation process result.

【0029】図3で示される実施形態例では、処理ブロ
ック302の推定処理にID=6を割り当てる。また、
演算子Rの特性から、引数は必ず二つである。上記の演
算子および演算規則を用いて、図3に示す導出処理を演
算式で表現すると次のようになる。
In the example embodiment shown in FIG. 3, ID = 6 is assigned to the estimation process of processing block 302. Also,
Due to the characteristics of the operator R, there are always two arguments. The derivation process shown in FIG. 3 is expressed as an arithmetic expression using the above-mentioned operators and arithmetic rules, as follows.

【0030】 O[A[R[M[1,2,3],6],4],5] すなわち、推定結果ID=1を“10110”、2を
“01100”、3を“10001”、4を“1110
1”、5を“11000”とし、図3の導出処理を順に
書き下すと、 M[1,2,3] →“10110” R[M[1,2,3],6] →“10110” A[R[M[1,2,3],6],4] →“10100” のようになる。したがって、最終的に、 O[A[R[M[1,2,3],6],4],5]→“11100” となる。
O [A [R [M [1,2,3], 6], 4], 5] That is, the estimation result ID = 1 is “10110”, 2 is “01100”, 3 is “10001”, 4 for "1110
When 1 ”and 5 are set to“ 11000 ”and the derivation process of FIG. 3 is sequentially written, M [1,2,3] →“ 10110 ”R [M [1,2,3], 6] →“ 10110 ” A [R [M [1,2,3], 6], 4] → “10100” Therefore, finally, O [A [R [M [1,2,3], 6]] , 4], 5] → “11100”.

【0031】ここで、演算子Mでは、“1”の数が1/
2以上であるならば“1”とし、1/2未満であるなら
ば“0”として推定結果を導出した。また、演算子Rで
は、その前の処理で出力された導出結果が“1”である
場合にのみ推定対象を限定して推定処理6を行った結
果、再び認識結果が正しいと推定される例を示した。
Here, in the operator M, the number of "1" is 1 /
The estimation result was derived as "1" if it was 2 or more and "0" if it was less than 1/2. Further, in the operator R, an example in which the recognition result is estimated to be correct again as a result of performing the estimation process 6 by limiting the estimation target only when the derivation result output in the previous process is “1” showed that.

【0032】尚、図3で示した導出法以外にも組み込み
可能であり、順序も図3で示した例に限定されるもので
はない。また、すべての演算子を必ず使用する必要はな
い。さらに、同じ演算子を複数回使用することも可能で
ある。これらを踏まえると、他の例として、推定結果
1,2,3の多数決をとって導出し、その結果さらに認
識結果が正しいと推定された結果に対して推定処理8を
行った結果と、推定結果4,5,6の論理和をとって導
出した結果と、推定結果7との三つの多数決をとって導
出する演算式は次のように表される。
The method other than the derivation method shown in FIG. 3 can be incorporated, and the order is not limited to the example shown in FIG. Also, not all operators need to be used. Furthermore, it is possible to use the same operator multiple times. Based on these, as another example, the estimation results 1, 2, and 3 are derived by taking a majority vote, and as a result, the estimation process 8 is performed on the result of which the recognition result is estimated to be correct. An arithmetic expression derived by taking the three majority decisions of the result obtained by taking the logical sum of the results 4, 5, 6 and the estimated result 7 is expressed as follows.

【0033】M[R[M[1,2,3],8],O
[4,5,6],7] また、はじめの推定結果1が“1”である場合にのみ推
定対象を限定して推定処理2を行うという処理を次々に
行っていって導出する演算式は次のように表される。
M [R [M [1,2,3], 8], O
[4, 5, 6], 7] Further, an arithmetic expression derived by sequentially performing the processing of limiting the estimation target and performing the estimation processing 2 only when the first estimation result 1 is "1". Is represented as follows.

【0034】 R[R[R[R[1,2],2],2],2] 以上の導出法により得られた単一の文字認識精度推定結
果に基づいて文字列入力手段を選択する方法の例を示
す。まず、文字列入力手段の例としては、キーボード等
を用いて文字列を直接入力することを想定した文字列入
力手段、文字認識を行い単語辞書等と突き合わせを行う
ことを想定した文字列入力手段、文字認識を行い認識結
果を修正することを想定した文字列入力手段、あるい
は、これらを併用した文字列入力手段(例えば同音語入
力方式)等があげられる。これらの各文字列入力手段に
ついて文字認識精度に対する相対的な入力効率曲線を描
き、各文字列入力手段間の入力効率の高低の転換点にお
ける文字認識精度値を閾値として、上記文字認識精度推
定結果から最も効率の高い文字列入力手段を判定し選択
する。
R [R [R [R [R] 1,2], 2], 2], 2] The character string input means is selected based on the single character recognition accuracy estimation result obtained by the above derivation method. An example of the method is shown. First, as an example of the character string input means, a character string input means assumed to directly input a character string using a keyboard or the like, a character string input means assumed to perform character recognition and match with a word dictionary, etc. , A character string input means that is supposed to perform character recognition and correct the recognition result, or a character string input means that uses these in combination (for example, a homophone input method). Draw a relative input efficiency curve for the character recognition accuracy for each of these character string input means, the character recognition accuracy value at the turning point of the input efficiency between each character string input means as a threshold, the above character recognition accuracy estimation result The most efficient character string input means is determined and selected.

【0035】[0035]

【発明の効果】以上、詳細に説明したように、本発明に
よれば、入力された文字イメージデータについて複数の
文字認識精度推定を行い、その複数の文字認識精度推定
結果から単一の文字認識精度推定結果を導出するように
したので、任意の推定アルゴリズムを自由に組み込み可
能となり、信頼性の高い文字認識精度推定結果導出法を
有する精度の高い文字列入力手段選択方法を実現できる
という顕著な効果を奏するものである。
As described above in detail, according to the present invention, a plurality of character recognition accuracy estimations are performed on input character image data, and a single character recognition is performed from the plurality of character recognition accuracy estimation results. Since the accuracy estimation result is derived, an arbitrary estimation algorithm can be freely incorporated, and a highly accurate character string input means selection method having a highly reliable character recognition accuracy estimation result derivation method can be realized. It is effective.

【0036】また、導出の過程を演算規則に対応させた
演算子を用いて記述した演算式に基き導出処理法および
導出順序を決定するようにした場合には、任意の順序で
自由に単一の文字認識精度推定結果の導出法を指定可能
な文字認識精度推定結果導出法を有する、処理が容易
で、精度の高い文字列入力手段選択方法を実現できると
いう顕著な効果を奏する。
Further, when the derivation processing method and the derivation order are determined based on the arithmetic expression described in the derivation process using the operator corresponding to the arithmetic rule, the derivation process can be freely performed in any order. It is possible to realize a character string input means selecting method which has a character recognition accuracy estimation result derivation method capable of designating a character recognition accuracy estimation result derivation method, and which is easy to process and has high accuracy.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態例を示す処理ブロック構成
を説明する図面である。
FIG. 1 is a diagram illustrating a processing block configuration according to an exemplary embodiment of the present invention.

【図2】上記処理ブロック構成中の文字認識精度推定結
果導出処理ブロックの処理の流れを説明する図面であ
る。
FIG. 2 is a diagram illustrating a processing flow of a character recognition accuracy estimation result derivation processing block in the above processing block configuration.

【図3】上記処理の流れ中において文字認識精度推定結
果を演算子を用いて導出する例を説明する図面である。
FIG. 3 is a diagram illustrating an example of deriving a character recognition accuracy estimation result using an operator in the flow of the above processing.

【符号の説明】[Explanation of symbols]

101,102,103,104,105…文字認識精
度を推定する処理ブロック 106…文字認識精度推定結果を導出する処理ブロック 107,108,109,110,111…文字認識精
度推定処理ブロックから出力された推定結果データ 112…文字認識精度推定結果導出法記述データ 113,114,115,116,117…文字認識処
理等、認識精度推定処理の前処理として行われた結果デ
ータ 201…個々の文字認識精度推定結果の入力処理を行う
処理ブロック 202…文字認識精度推定結果導出法記述ファイル等を
入力する処理ブロック 203…文字認識精度推定結果を導出する規則を記述フ
ァイル等から解釈して決定する処理ブロック 204…演算規則に基づく、個々の文字認識精度推定結
果を導出する処理ブロック 205…導出処理の終了を判定する処理ブロック 206…文字認識精度推定結果の導出結果を出力する処
理ブロック 301…複数の導出(推定)結果を多数決により導出す
る処理ブロック 302…前の導出(推定)処理で出力された導出(推
定)結果に応じて推定対象を限定し、推定処理を行う処
理ブロック 303…複数の導出(推定)結果を論理積により導出す
る処理ブロック 304…複数の導出(推定)結果を論理和により導出す
る処理ブロック 305,306,307,308,309…文字認識精
度推定処理ブロックから出力された推定結果データ
101, 102, 103, 104, 105 ... Processing block for estimating character recognition accuracy 106 ... Processing block for deriving character recognition accuracy estimation result 107, 108, 109, 110, 111 ... Output from character recognition accuracy estimation processing block Estimation result data 112 ... Character recognition accuracy estimation result derivation method descriptive data 113, 114, 115, 116, 117 ... Result data 201 pre-processed for recognition accuracy estimation processing such as character recognition processing 201 ... Individual character recognition accuracy estimation Processing block for inputting result 202 Processing block for inputting character recognition accuracy estimation result derivation method description file 203 Processing block for interpreting and determining rule for deriving character recognition accuracy estimation result from description file 204 A processing block that derives the individual character recognition accuracy estimation results based on the calculation rules. 205 ... Processing block for determining end of derivation processing 206 ... Processing block for outputting derivation result of character recognition accuracy estimation result 301 ... Processing block for deriving a plurality of derivation (estimation) results by majority decision 302 ... Previous derivation (estimation) ) A processing block 303 that performs estimation processing by limiting the estimation target according to the derivation (estimation) result output by the processing ... Processing block that derives a plurality of derivation (estimation) results by logical product 304 ... Plural derivation (estimation) ) Processing block deriving a result by logical sum 305, 306, 307, 308, 309 ... Estimation result data output from the character recognition accuracy estimation processing block

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 文字イメージデータを文字コードに変換
し、文字認識精度推定結果に基づいて複数の文字列入力
手段の中から入力効率の高いものを選択する文字列入力
手段選択方法において、 入力された文字イメージデータについて複数の文字認識
精度推定を行う段階と、 前記複数の文字認識精度推定の推定結果から単一の文字
認識精度推定結果を導出する段階と、 前記導出された単一の文字認識推定結果に基づいて複数
の文字列入力手段の中から入力効率の高いものを選択す
る段階と、 を有することを特徴とする文字列入力手段選択方法。
1. A character string input means selecting method for converting character image data into a character code and selecting one having a high input efficiency from a plurality of character string input means based on a result of character recognition accuracy estimation. Performing a plurality of character recognition accuracy estimations for the character image data, deriving a single character recognition accuracy estimation result from the plurality of character recognition accuracy estimation results, and the derived single character recognition And a step of selecting a character string input means having a high input efficiency from a plurality of character string input means based on the estimation result.
【請求項2】 複数の文字認識精度推定結果から単一の
文字認識精度推定結果を導出する段階は、 前記導出の過程を演算規則に対応させた演算子を定義
し、それら演算子を用いて構成された演算式に基づいて
前記単一の文字認識精度推定結果を導出する処理手法お
よび導出していく順序を決定する過程を有することを特
徴とする請求項1記載の文字列入力手段選択方法。
2. The step of deriving a single character recognition accuracy estimation result from a plurality of character recognition accuracy estimation results defines operators that correspond the calculation process to the operation rules, and uses the operators. 2. The method for selecting character string input means according to claim 1, further comprising a processing method for deriving the single character recognition accuracy estimation result and a step of deciding the order of deriving based on the constructed arithmetic expression. .
【請求項3】 演算子を用いて構成された演算式に基づ
いて単一の文字認識精度推定結果を導出する処理手法お
よび導出していく順序を決定する過程は、 利用者が記述した演算子の並びにより単一の文字認識精
度推定結果を導出する順序を決定する過程と、 予め演算子に対応づけられた導出処理の種類を決定する
過程と、 利用者が演算子の引数として記述した文字認識精度推定
結果のIDナンバ、または文字認識精度推定処理のID
ナンバを基に、処理の対象とする文字認識精度推定結果
や推定処理を決定する過程と、 を有することを特徴とする請求項2記載の文字列入力手
段選択方法。
3. A processing method for deriving a single character recognition accuracy estimation result based on an arithmetic expression formed by using an operator and a process of deciding the order of derivation are performed by an operator described by a user. , The process of deciding the order of deriving a single character recognition accuracy estimation result, the process of deciding the type of derivation process associated with the operator in advance, and the characters described by the user as arguments of the operator. ID number of recognition accuracy estimation result or ID of character recognition accuracy estimation process
3. The character string input means selection method according to claim 2, further comprising: a step of determining a character recognition accuracy estimation result or an estimation process to be processed based on the number.
JP8009704A 1996-01-24 1996-01-24 Method for selecting character string input means Pending JPH09204490A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8009704A JPH09204490A (en) 1996-01-24 1996-01-24 Method for selecting character string input means

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8009704A JPH09204490A (en) 1996-01-24 1996-01-24 Method for selecting character string input means

Publications (1)

Publication Number Publication Date
JPH09204490A true JPH09204490A (en) 1997-08-05

Family

ID=11727635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8009704A Pending JPH09204490A (en) 1996-01-24 1996-01-24 Method for selecting character string input means

Country Status (1)

Country Link
JP (1) JPH09204490A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282964A (en) * 1998-03-26 1999-10-15 Nec Corp Character recognition device, learning method and storage medium for recording character recognition program
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282964A (en) * 1998-03-26 1999-10-15 Nec Corp Character recognition device, learning method and storage medium for recording character recognition program
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system
JP2019128690A (en) * 2018-01-23 2019-08-01 株式会社野村総合研究所 Handwritten character recognition system

Similar Documents

Publication Publication Date Title
AU2019419888B2 (en) System and method for information extraction with character level features
WO2018040899A1 (en) Error correction method and device for search term
CN112183486B (en) Method for rapidly identifying single-molecule nanopore sequencing base based on deep network
WO2020143320A1 (en) Method and apparatus for acquiring word vectors of text, computer device, and storage medium
JP2010044637A (en) Data processing apparatus, method, and program
CN110245349B (en) Syntax dependence analysis method and apparatus, and electronic device
WO2016112782A1 (en) Method and system of extracting user living range
US11568150B2 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space
CN113986950A (en) SQL statement processing method, device, equipment and storage medium
CN108664464B (en) Method and device for determining semantic relevance
CN111968624B (en) Data construction method, device, electronic equipment and storage medium
JPH09204490A (en) Method for selecting character string input means
KR20230059524A (en) Method and apparatus for analyzing multimodal data
JP2003108187A (en) Method and program for similarity evaluation
JP6210934B2 (en) Topic conversion detection device, method, and program
JP7430274B2 (en) Computer system and character recognition method
CN117349186B (en) Program language defect positioning method, system and medium based on semantic flowsheet
CN117172323B (en) Patent multi-domain knowledge extraction method and system based on feature alignment
JP4614582B2 (en) Partial template generator
JP2022073635A (en) Vectorization program, vectorization method, and information processing device
JPH0795337B2 (en) Word recognition method
JP2023010430A (en) Calculator and character recognition method
KR20220097844A (en) Apparatus for processing unstructured document capable of extracting units and unit value and method thereof
CN115033682A (en) Self-adaptive training method, device, equipment and medium of text generation model
JP2023157600A (en) Threshold setting method, similar string determination method, threshold setting device, similar string determination device, and program