JPH096921A - Method and device for inputting character string - Google Patents

Method and device for inputting character string

Info

Publication number
JPH096921A
JPH096921A JP7159037A JP15903795A JPH096921A JP H096921 A JPH096921 A JP H096921A JP 7159037 A JP7159037 A JP 7159037A JP 15903795 A JP15903795 A JP 15903795A JP H096921 A JPH096921 A JP H096921A
Authority
JP
Japan
Prior art keywords
character
rate
input
character recognition
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7159037A
Other languages
Japanese (ja)
Inventor
Osamu Nakamura
修 中村
Kimitomo Kobayashi
公知 小林
Sueki Matsumura
季樹 松村
Yoshimasa Kimura
義政 木村
Masaharu Kurakake
正治 倉掛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7159037A priority Critical patent/JPH096921A/en
Publication of JPH096921A publication Critical patent/JPH096921A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To provide a method and device for character string input which can mechanically select a proper input method corresponding to variation in the front of input characters. CONSTITUTION: As for inputted character image data 105, a character quality evaluation processing block 101 estimates the correct answer rate of a character candidate of 1st order, i.e., a character recognition rate at the time of character recognition and the rate at which the correct answer character candidate is included in character candidates of up to (n)th order, i.e., a correct answer character candidate inclusion rate. Further, a means which has the shortest time required for conversion processing, i.e., the shortest input means is selected out of input means 102-104 which convert the character image data into character codes. By the selected input means, character strings are inputted with high input efficiency corresponding to input character quality at all times.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識技術を利用し
て日本語文字列等を計算機システム等に入力する処理に
関し、特に認識対象とする文字の品質に応じて文字列入
力の効率が最大となる入力手段を選択することで効率の
良い文字列入力方式を実現するための技術に関するもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a process for inputting a Japanese character string or the like into a computer system or the like using character recognition technology, and in particular, the efficiency of character string input depends on the quality of the character to be recognized. The present invention relates to a technique for realizing an efficient character string input method by selecting the maximum input means.

【0002】[0002]

【従来の技術】スキャナやFAXから入力された文字イ
メージデータを、テキストデータとして計算機が処理可
能な文字コードへ機械的に変換するための文字認識技術
は、人手による文字入力稼働を削減する点で有用な技術
と考えられている。文字認識技術では、予め学習された
文字パタンとの類似性によって、入力された文字イメー
ジデータがいずれの文字であるかを識別することを処理
の基本としている。このため、手書き文字に比べて比較
的字体の変形が少ない印刷文字に対しては認識性能は安
定しており、この技術を利用した製品が多数発表されて
いる。
2. Description of the Related Art A character recognition technique for mechanically converting character image data input from a scanner or a fax into a character code that can be processed by a computer as text data is to reduce manual input operation of characters. Considered a useful technique. In the character recognition technique, the basic processing is to identify which character the input character image data is, based on the similarity with the previously learned character pattern. For this reason, the recognition performance is stable for printed characters whose fonts are relatively less deformed than handwritten characters, and many products using this technology have been announced.

【0003】しかし、手書き文字に対しては、記入者に
よって字体がまちまちであるため、学習させた字体と異
なる字体に対しては正しい識別を行うことが困難とな
り、データ入力稼働の削減の効果は著しく低下する。こ
のような文字認識技術の、手書き文字に対する脆弱性に
もかかわらず現状の文字認識システムでは、様々な字体
を入力させ、認識誤りに対しては直接キー入力する方法
よりも効率の悪い修正作業を強いているのが現状であ
る。
However, for handwritten characters, the character styles are different depending on the person who entered the text, and it is difficult to correctly identify a character style different from the learned character style. Markedly reduced. In spite of the vulnerability of such character recognition technology to handwritten characters, the current character recognition system requires various types of fonts to be input, and correction errors that are less efficient than direct key input methods are required. The situation is strong.

【0004】[0004]

【発明が解決しようとする課題】上述のとおり、従来の
文字認識技術を用いた文字列入力の方法には、入力文字
の字体変形(文字品質)の変動に依らず画一的に文字認
識を実行してしまうために、特に字体変動の大きい文字
を入力した場合に、文字認識技術を用いずに直接キーボ
ードから入力する場合よりも却って入力時間が多くかか
り、文字認識の効果を発揮できないという問題があっ
た。
As described above, the conventional character string inputting method using the character recognition technology is capable of uniform character recognition regardless of variations in the font deformation (character quality) of the input character. Since it is executed, especially when inputting characters with large font variations, it takes longer time to input than when inputting directly from the keyboard without using character recognition technology, and the effect of character recognition cannot be exhibited. was there.

【0005】本発明は上記事情に鑑みてなされたもの
で、その目的とするところは、従来の技術における上述
のような問題を解消し、入力文字の字体変動に対応した
適切な入力方法を機械的に選択することが可能な文字列
入力方法および装置を提供することにある。
The present invention has been made in view of the above circumstances, and an object of the present invention is to solve the above-mentioned problems in the prior art and to provide an appropriate input method for a character variation of an input character as a machine. To provide a character string input method and device that can be selectively selected.

【0006】[0006]

【課題を解決するための手段】本発明の上述の目的を達
成するため、本発明では、文字イメージデータを文字コ
ードに変換する処理において、入力された文字イメージ
データについて、文字認識を行った場合の第1位文字候
補の正解率すなわち文字認識率と正解文字候補が第n位
までの文字候補中に含まれる率すなわち正解文字候補包
含率とを推定する段階と、前記推定した文字認識率およ
び正解文字候補包含率の推定結果に基づいて、文字列イ
メージデータを文字コードに変換する複数の変換手段の
内、前記変換処理に要する時間が最短となる変換手段を
選択する段階と、を有することを特徴とする文字列入力
方法を手段とする。
In order to achieve the above-mentioned object of the present invention, in the present invention, when character recognition is performed on input character image data in a process of converting character image data into a character code. Of estimating the correct answer rate of the first-ranked character candidates, that is, the character recognition rate, and the rate of the correct-character candidates included in the character candidates up to the n-th order, that is, the correct-character candidate inclusion rate, and the estimated character recognition rate and Selecting a conversion means that minimizes the time required for the conversion processing among a plurality of conversion means that converts the character string image data into a character code based on the estimation result of the correct character candidate inclusion rate. A character string input method characterized by

【0007】上記の文字列入力方法において、入力され
た文字イメージデータについて文字認識率と正解文字候
補包含率を推定する段階は、複数の文字認識アルゴリズ
ムによる文字認識結果の第1位文字候補の一致度から文
字認識率を推定する過程と、認識する各文字について類
似パタンとなる文字候補の集合を定めておき前記類似パ
タン文字候補が実際の文字認識結果中に含まれている程
度を観測して正解文字候補包含率を推定する過程と、を
有する構成とするのが好適である。
In the above character string input method, the step of estimating the character recognition rate and the correct answer candidate inclusion rate for the input character image data is performed by matching the first-ranked character candidates of the character recognition results by a plurality of character recognition algorithms. The process of estimating the character recognition rate from the degree and a set of character candidates that are similar patterns for each character to be recognized are defined and the degree to which the similar pattern character candidates are included in the actual character recognition result is observed. It is preferable that the configuration includes a step of estimating the correct character candidate inclusion rate.

【0008】また、推定した文字認識率および正解文字
候補包含率の推定結果に基づいて、文字列イメージデー
タを文字コードに変換する複数の変換手段の内、前記変
換処理に要する時間が最短となる変換手段を選択する段
階は、予め各変換手段について、文字認識率および正解
文字候補包含率と変換処理に要する時間との関係を観測
し、各変換手段の優劣が逆転する文字認識率および正解
文字候補包含率の規定値を求めておく過程と、前記推定
した文字認識率および正解文字候補包含率の推定結果の
値と前記規定値を比較して各変換手段の優劣を判断する
ことにより、変換処理に要する時間が最短となる変換手
段を選択する過程と、を有する構成とするのが好適であ
る。
Further, among the plurality of converting means for converting the character string image data into the character code based on the estimated result of the estimated character recognition rate and the correct answer candidate inclusion rate, the time required for the converting process becomes the shortest. In the step of selecting the conversion means, for each conversion means, the relationship between the character recognition rate, the correct character candidate inclusion rate, and the time required for the conversion process is observed in advance, and the character recognition rate and the correct character in which the merits and demerits of each conversion means are reversed. The process of obtaining the specified value of the candidate coverage, and comparing the estimated character recognition rate and the value of the estimation result of the correct character candidate coverage with the specified value to determine the superiority or inferiority of each conversion means. It is preferable to adopt a configuration including a process of selecting a conversion unit that requires the shortest processing time.

【0009】さらに、本発明の上述の目的を達成するた
め、本発明では、文字イメージデータを文字コードに変
換する装置において、入力された文字イメージデータに
ついて、文字認識を行った場合の第1位文字候補の正解
率すなわち文字認識率を推定する手段と、前記文字認識
における正解文字候補が第n位までの文字候補中に含ま
れる率すなわち正解文字候補包含率を推定する手段と、
前記推定した文字認識率および正解文字候補包含率の推
定結果に基づいて、文字列イメージデータを文字コード
に変換する複数の変換手段の内、前記変換処理に要する
時間が最短となる変換手段を選択する手段と、を備える
ことを特徴とする文字列入力装置を手段とする。
Further, in order to achieve the above-mentioned object of the present invention, in the present invention, in a device for converting character image data into a character code, the first place in the case of performing character recognition on input character image data. Means for estimating a correct answer rate of the character candidates, that is, a character recognition rate; and means for estimating a rate of correct character candidates in the character recognition included in the character candidates up to the nth, that is, a correct answer candidate inclusion rate.
Based on the estimation results of the estimated character recognition rate and the correct answer candidate inclusion rate, a conversion means that minimizes the time required for the conversion processing is selected from a plurality of conversion means that converts the character string image data into a character code. And a means for performing the character string input device.

【0010】[0010]

【作用】本発明に係わる文字列入力方法およびその装置
においては、入力された文字イメージデータの文字品質
を文字認識率および正解文字候補包含率の推定結果で評
価して、入力文字品質に対応して文字列イメージデータ
を文字コードに変換する処理に要する時間が最短となる
変換手段を選択することにより、入力文字品質に応じて
高い入力効率で文字列入力が行えるようにする。
In the character string input method and the apparatus thereof according to the present invention, the character quality of the input character image data is evaluated based on the estimation results of the character recognition rate and the correct character candidate inclusion rate to correspond to the input character quality. By selecting the conversion means that minimizes the time required for converting the character string image data into the character code, the character string can be input with high input efficiency according to the input character quality.

【0011】具体的には、入力文字品質が高い場合には
文字認識結果を直接利用する変換手段を選択し、また、
入力文字品質が中程度の場合には入力文字列に対応した
単語辞書との突き合わせを行って文字認識誤りを補正す
る変換手段を選択し、さらにその文字認識誤りを補正す
る作業の効率が悪い程度に入力文字品質が低い場合には
キーボード等から直接入力する変換手段を選択すること
により、常にキーボード等から直接入力する方法以上の
入力効率で文字列入力できるようにする。
Specifically, when the input character quality is high, a conversion means for directly using the character recognition result is selected, and
If the input character quality is medium, the efficiency of the work of selecting the conversion means that corrects the character recognition error by matching with the word dictionary corresponding to the input character string and further correcting the character recognition error is low. When the input character quality is low, by selecting the conversion means for directly inputting from the keyboard or the like, the character string can be input with the input efficiency higher than that of the method of directly inputting from the keyboard or the like.

【0012】[0012]

【実施例】以下、図面を用いて本発明の実施例を説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0013】図1は、本発明の一実施例に係わる文字列
入力方法および装置の処理ブロック図である。図1にお
いて、101は、文字品質評価処理ブロックである。1
02、103、104は、文字イメージデータを文字列
コードに変換する手段、すなわち具体的に文字列入力を
行うための入力手段である。尚、図1においては、説明
の便宜上、入力手段を3種類とした場合の一例を示して
いるが、文字列入力の観点から効果があれば良く、入力
手段の種類数は本発明の趣旨とは無関係である。また、
その種類も限定されるものではないが、説明を具体的に
進めていくため、以降、102を文字認識および認識修
正による入力手段とし、103を文字認識および単語辞
書との突き合わせ(単語照合)による入力手段とし、1
04を文字認識を用いずにキーボードから直接人手によ
って入力する入力手段とする。
FIG. 1 is a processing block diagram of a character string input method and apparatus according to an embodiment of the present invention. In FIG. 1, 101 is a character quality evaluation processing block. 1
02, 103, and 104 are means for converting character image data into a character string code, that is, input means for specifically inputting a character string. In FIG. 1, for convenience of explanation, an example in which there are three types of input means is shown, but it is sufficient if there is an effect from the viewpoint of character string input, and the number of types of input means is the same as the gist of the present invention. Is irrelevant. Also,
Although the type thereof is not limited, in order to specifically proceed with the description, hereinafter, 102 is used as an input means for character recognition and recognition correction, and 103 is used for character recognition and matching with a word dictionary (word matching). 1 as input means
Reference numeral 04 is an input means for manually inputting directly from the keyboard without using character recognition.

【0014】本実施例による具体的な文字列入力の方法
を以下に説明する。まず、文字品質評価処理ブロック1
01では、入力された文字イメージデータ105を対象
にして文字品質の評価を行う。すなわち、入力された文
字イメージデータ105に対して文字認識を実行した場
合の第1位文字候補の正解率(文字認識率)と正解文字
候補が文字候補順位中のn位までに含まれる率(正解文
字候補包含率)を推定する。文字品質評価処理ブロック
101における文字認識率および正解文字候補包含率の
推定方法については、後に図5を用いて詳細に説明す
る。
A specific character string input method according to this embodiment will be described below. First, the character quality evaluation processing block 1
In 01, the character quality is evaluated for the input character image data 105. That is, the correct answer rate (character recognition rate) of the first-ranked character candidates when character recognition is performed on the input character image data 105 and the rate of correct answer character candidates included up to the nth position in the character candidate ranking ( Estimate the correct character candidate coverage). The method of estimating the character recognition rate and the correct answer candidate inclusion rate in the character quality evaluation processing block 101 will be described later in detail with reference to FIG.

【0015】尚、文字イメージデータ105の入力は、
例えば文字品質が一定していると想定できる帳票単位や
ページ単位に行い、その範囲を対象として入力手段の選
択を行う。もちろん、任意の範囲を指定してその範囲で
の入力手段の選択を行うことも可能である。また、文字
認識率や正解文字候補包含率は、1文字単位に推定でき
るが、その場合には、例えば、入力された文字イメージ
データの範囲の各文字についての推定値の平均などを推
定結果とする。
The input of the character image data 105 is as follows.
For example, it is performed for each form or page for which it can be assumed that the character quality is constant, and the input means is selected for that range. Of course, it is also possible to specify an arbitrary range and select the input means within that range. In addition, the character recognition rate and the correct answer candidate inclusion rate can be estimated on a character-by-character basis. In that case, for example, the average of estimated values for each character in the range of input character image data is used as the estimation result. To do.

【0016】次に、文字品質評価処理ブロック101で
は、選択可能な入力手段102、103、104の内、
推定した文字認識率および正解文字候補包含率の推定結
果に適した入力手段を選択する。具体的には例えば、規
定の文字認識率X%以上の場合には、起動情報106に
より入力手段102を選択し、文字認識率がX%未満で
あって、かつ正解文字候補包含率が規定のY%以上であ
った場合には、起動情報107により入力手段103を
選択し、さらに、文字認識率がX%未満であって、かつ
正解文字候補包含率がY%未満であった場合には、起動
情報108により入力手段104を選択する等の方法を
採ることができる。上記の起動情報には、文字認識を行
う場合のように必要な場合には文字イメージデータが含
まれる。こうして、選択された入力手段は、文字イメー
ジデータを文字列コード109に変換して、例えば、計
算機システム等に入力する。
Next, in the character quality evaluation processing block 101, of the selectable input means 102, 103, 104,
The input means suitable for the estimated result of the estimated character recognition rate and the correct answer candidate inclusion rate is selected. Specifically, for example, when the specified character recognition rate is X% or more, the input unit 102 is selected by the activation information 106, the character recognition rate is less than X%, and the correct character candidate inclusion rate is specified. If it is Y% or more, the input means 103 is selected by the start information 107, and if the character recognition rate is less than X% and the correct character candidate inclusion rate is less than Y%. A method such as selecting the input means 104 according to the activation information 108 can be adopted. The above startup information includes character image data when necessary, such as when performing character recognition. In this way, the selected input means converts the character image data into the character string code 109 and inputs it to, for example, a computer system or the like.

【0017】尚、規定値Xは、文字認識を行った場合の
第1位文字候補がこの規定値X%以上であった場合に、
入力手段102による文字列入力の効率が、他の入力手
段103、104による効率よりも高い(変換処理に要
する時間、すなわち入力時間が短い)と判断される値で
ある。また、規定値Yは、文字認識率がY%未満であ
り、かつ正解文字候補包含率がこの規定値Y%以上であ
った場合に入力手段103による文字列入力の効率が、
他の入力手段102、104による効率よりも高いと判
断される値である。
It should be noted that the prescribed value X is the value when the first-ranked character candidate in the case of character recognition is the prescribed value X% or more,
This is a value that is determined as the efficiency of character string input by the input unit 102 being higher than the efficiency of the other input units 103 and 104 (time required for conversion processing, that is, input time is short). Further, when the specified value Y is the character recognition rate is less than Y% and the correct character candidate inclusion rate is not less than the specified value Y%, the efficiency of the character string input by the input means 103 is
This is a value determined to be higher than the efficiency of the other input means 102, 104.

【0018】以上のとおり図1に示した文字列入力方法
により、入力されるイメージデータ中の文字の品質に応
じて入力手段を切り替えることにより、常に最大の文字
列入力効率で文字列入力を行うことが可能となる。
As described above, according to the character string input method shown in FIG. 1, the input means is switched according to the quality of the characters in the input image data, so that the character string input is always performed with the maximum character string input efficiency. It becomes possible.

【0019】図2は、入力される文字の品質と、文字認
識率および正解文字包含率との関係の一例を説明するた
めの図面である。図2において、201は入力文字品質
に対する文字認識率を示し、202は、入力文字品質に
対する正解文字候補のn位までの包含率を示している。
nが1の場合には、文字認識率201と正解文字候補包
含率202は同じ値となる。
FIG. 2 is a diagram for explaining an example of the relationship between the quality of input characters and the character recognition rate and the correct answer inclusion rate. In FIG. 2, 201 shows the character recognition rate with respect to the input character quality, and 202 shows the coverage rate up to the nth position of the correct character candidate with respect to the input character quality.
When n is 1, the character recognition rate 201 and the correct character candidate inclusion rate 202 have the same value.

【0020】文字認識率は前記のとおり第1位文字候補
の正解率で、この率が高ければ高い程、後の認識誤りに
対する修正量が減少し、この減少に伴って文字列入力の
効率が高まる。しかし、現在の文字認識技術のレベルで
は、特に手書き文字については、文字認識率は図2の2
01に示すように入力文字品質が大きく左右され、ま
た、図1中の入力手段102に示した、文字認識および
認識修正による方法が最も有効となるためには、100
%近くの認識率である必要がある。一方、正解文字候補
包含率202は、図2に示したとおり、同一の文字認識
アルゴリズムを使用した場合、全ての文字品質に対して
文字認識率より高い値となる。このため、文字認識率が
低い場合であっても、正解文字候補包含率が高い場合に
は、文字認識誤りを単語辞書との突き合わせによって補
正する入力手段103が最も効率の良い文字列入力手段
になる可能性が高い。
As described above, the character recognition rate is the accuracy rate of the first-ranked character candidate. The higher the rate, the smaller the correction amount for the subsequent recognition error. Increase. However, at the current level of character recognition technology, especially for handwritten characters, the character recognition rate is 2 in FIG.
As shown in 01, the input character quality is greatly influenced, and in order that the method of character recognition and recognition correction shown in the input means 102 in FIG.
The recognition rate should be close to%. On the other hand, as shown in FIG. 2, when the same character recognition algorithm is used, the correct answer candidate inclusion rate 202 is higher than the character recognition rate for all character qualities. Therefore, even if the character recognition rate is low, if the correct character candidate inclusion rate is high, the input unit 103 that corrects the character recognition error by matching with the word dictionary becomes the most efficient character string input unit. Is likely to be.

【0021】図3は、入力される文字の品質と、各種の
文字列入力手段の相対的な文字列入力効率との関係を想
定した一例を示す図面である。図3において、301
は、文字列をキーボードから直接入力する場合の入力効
率を示しており、他の入力手段の文字列入力効率30
2、303の想定的な効率を算出するための正規化基準
値である。文字列入力効率を表す単位には、例えば単位
時間当たりの入力可能な文字数を用いることができる。
キーボードからの直接入力では、入力者が解読可能な文
字列であれば、その入力効率は入力文字の品質に左右さ
れないため、図3中のグラフ301は文字品質の高低に
依らず直線となる。302は、文字認識および単語辞書
との突き合わせを想定した文字列入力手段の相対的な文
字列入力効率を示している。
FIG. 3 is a diagram showing an example in which the relationship between the quality of input characters and the relative character string input efficiency of various character string input means is assumed. In FIG. 3, 301
Indicates the input efficiency when a character string is directly input from the keyboard, and the character string input efficiency of other input means is 30.
It is a normalized reference value for calculating the assumed efficiency of 2,303. As the unit indicating the character string input efficiency, for example, the number of characters that can be input per unit time can be used.
In the case of a direct input from the keyboard, if the character string is readable by the input person, the input efficiency does not depend on the quality of the input character. Therefore, the graph 301 in FIG. 3 is a straight line regardless of whether the character quality is high or low. Reference numeral 302 shows the relative character string input efficiency of the character string input means assuming character recognition and matching with a word dictionary.

【0022】尚、302は、301の値を正規化基準値
とした場合の相対値である。303は、文字認識および
認識結果の認識修正を想定した文字列入力手段の相対的
な入力効率を示している。尚、303も301の値を正
規化基準値とした場合の相対値である。304は、入力
効率301の入力手段(図1中の104)と入力効率3
02の入力手段(図1中の103)の優劣が逆転する文
字品質の値を示し、305は、入力効率302の入力手
段103と入力効率303の入力手段(図1中の10
2)優劣が逆転する文字品質の値を示している。
Reference numeral 302 is a relative value when the value of 301 is used as a normalization reference value. Reference numeral 303 indicates the relative input efficiency of the character string input means assuming character recognition and recognition correction of the recognition result. Note that 303 is also a relative value when the value of 301 is used as a normalization reference value. Reference numeral 304 denotes an input unit of the input efficiency 301 (104 in FIG. 1) and the input efficiency 3
02 indicates the value of the character quality at which the superiority or inferiority of the input means (103 in FIG. 1) is reversed, and 305 indicates the input means 103 of the input efficiency 302 and the input means of the input efficiency 303 (10 in FIG. 1).
2) Shows the value of character quality in which superiority and inferiority are reversed.

【0023】図3に示すように、入力文字品質の変化に
応じて、文字列入力効率が最大となる入力手段が異な
る。図3の例では、文字入力品質304では、キーボー
ドからの直接の入力手段104の効率と、文字認識およ
び単語辞書との突き合わせによる入力手段103の効率
とが交差しており、2つの入力手段の優劣が逆転してい
る。さらに、入力文字品質305では、文字認識および
単語辞書との突き合わせによる入力手段103の効率
と、文字認識および認識確認の確認修正による入力手段
102の効率とが交差しており、これら2つの入力手段
の優劣が逆転している。図3に示したように、3種の入
力手段の優劣が逆転する文字品質の値(規定値)304
ならびに305を予め観測しておくことで、いずれの文
字品質の条件においても最大の入力効率で文字列入力を
実行することが可能となる。
As shown in FIG. 3, the input means that maximizes the character string input efficiency differs depending on the change in the input character quality. In the example of FIG. 3, in the character input quality 304, the efficiency of the direct input means 104 from the keyboard and the efficiency of the input means 103 by character recognition and matching with the word dictionary intersect, and thus the efficiency of the two input means is reduced. The merits and demerits are reversed. Further, in the input character quality 305, the efficiency of the input means 103 by character recognition and matching with a word dictionary and the efficiency of the input means 102 by confirmation and correction of character recognition and recognition confirmation intersect, and these two input means are used. The merits and demerits of are reversed. As shown in FIG. 3, the character quality value (specified value) 304 at which the merits and demerits of the three types of input means are reversed.
Also, by observing 305 and 305 in advance, it is possible to perform the character string input with the maximum input efficiency under any character quality condition.

【0024】図4は、文字品質に応じて文字列入力の最
大効率を発揮することができる場合の、本発明による文
字列入力効率を示している。401は、図3に示した3
種の入力手段の文字列入力効率のそれぞれ最大となる領
域を統合した効率を示している。図3にも示したとお
り、各入力手段の優劣が逆転する文字品質の値304、
305を推定することは、本発明の効果を左右するため
重要である。文字品質は、図1の説明で示したように、
文字認識率および正解文字候補包含率によって定める。
例えば、305は文字認識率によって定義し、304は
正解文字候補包含率によって定義する。すなわち、文字
認識および認識修正による入力手段102が最も効果的
である領域では、文字認識率からの影響が最も大きいた
め下限の文字認識率305を定める必要がある。一方、
文字認識および単語辞書との突き合わせによる入力手段
103が最も効果的である領域では、正解文字候補の包
含率からの影響が最も大きいため下限の正解文字候補包
含率304を定める必要がある。
FIG. 4 shows the character string input efficiency according to the present invention when the maximum efficiency of character string input can be achieved according to the character quality. 401 is 3 shown in FIG.
It shows the efficiency of integrating the regions that maximize the character string input efficiencies of each type of input means. As shown in FIG. 3, the character quality value 304 in which the superiority or inferiority of each input means is reversed,
Estimating 305 is important because it affects the effect of the present invention. As shown in the explanation of FIG. 1, the character quality is
It is determined by the character recognition rate and the correct answer candidate inclusion rate.
For example, 305 is defined by the character recognition rate, and 304 is defined by the correct character candidate inclusion rate. That is, in the area where the input unit 102 for character recognition and recognition correction is most effective, the character recognition rate has the greatest influence, and therefore the lower limit character recognition rate 305 needs to be set. on the other hand,
In the area where the input means 103 by character recognition and matching with the word dictionary is most effective, the influence from the coverage rate of correct character candidates is the greatest, so it is necessary to determine the lower limit correct content candidate coverage rate 304.

【0025】図5は、図1中の文字品質評価処理ブロッ
ク101の詳細を説明するための図面である。図5中の
501は第1位文字候補の正解率(文字認識率)を推定
する処理ブロック、502は第n位までに正解文字候補
が含まれる率(正解文字候補包含率)を推定する処理ブ
ロックである。ここでnは、任意に設定可能な定数であ
り、具体的には2〜32程度の整数値とする場合が一般
的である。503は、処理ブロック501および502
による文字認識率および正解文字候補包含率に基づい
て、文字列入力効率が最大となる入力手段を選択する処
理ブロックである。
FIG. 5 is a drawing for explaining the details of the character quality evaluation processing block 101 in FIG. In FIG. 5, reference numeral 501 denotes a processing block for estimating the correct answer rate (character recognition rate) of the first-ranked character candidates, and 502 is processing for estimating a correct answer character candidate inclusion rate (correct answer character candidate inclusion rate) up to the nth position. It is a block. Here, n is a constant that can be set arbitrarily, and in general, it is generally an integer value of about 2 to 32. 503 is processing blocks 501 and 502.
It is a processing block that selects the input means that maximizes the character string input efficiency based on the character recognition rate and the correct answer candidate inclusion rate.

【0026】処理ブロック501における文字認識率の
推定は、複数の文字認識アルゴリズムによる文字認識結
果の第1位文字候補の一致度から推定するなどにより実
現できる。また、処理ブロック502における正解文字
候補の推定は、各文字について類似パタンとなる文字候
補の集合を定めておき、それらの類似パタン文字候補が
実際の文字認識結果中にどの程度含まれているを観測す
る等の手法により推定可能である。処理ブロック503
における入力手段の選択は、予め各入力手段について、
文字認識率および正解文字候補包含率と入力時間との関
係を観測し、各入力手段の優劣が逆転する文字認識率お
よび正解文字候補包含率を求めておくことで実現可能で
ある。例えば、文字列入力手段としてA、B、Cの3種
を想定し、文字認識率X%の場合に手段Aの文字列入力
効率が最も高く、文字認識率がX%未満であってかつ正
解文字包含率がY%以上の場合に手段Bの文字列入力効
率が最も高く、文字認識率がX%未満であってかつ正解
文字候補包含率がY%未満の場合に手段Cの文字列入力
効率が最も高いという観測結果が得られているとする。
このような観測結果のもとでは、処理ブロック503
は、文字認識率および正解文字候補包含率の推定結果を
上記の各条件に当てはめ、文字列入力効率が最大となる
入力手段を選択すればよい。
The estimation of the character recognition rate in the processing block 501 can be realized by estimating from the matching degree of the first-ranked character candidates of the character recognition results by a plurality of character recognition algorithms. Further, in the estimation of the correct character candidates in the processing block 502, a set of character candidates having similar patterns is determined for each character, and the degree to which these similar pattern character candidates are included in the actual character recognition result is determined. It can be estimated by a method such as observation. Processing block 503
The selection of the input means in
This can be realized by observing the relationship between the character recognition rate and the correct character candidate inclusion rate and the input time, and obtaining the character recognition rate and the correct character candidate inclusion rate at which the merits and demerits of each input means are reversed. For example, assuming three kinds of character string input means, A, B, and C, when the character recognition rate is X%, the character string input efficiency of the means A is the highest, the character recognition rate is less than X%, and the correct answer is given. When the character coverage is Y% or more, the character string input efficiency of the means B is the highest, and when the character recognition rate is less than X% and the correct character candidate coverage is less than Y%, the character string input of the means C is performed. It is assumed that the observation result that the efficiency is highest is obtained.
Under such an observation result, processing block 503
For the above, the estimation results of the character recognition rate and the correct answer candidate inclusion rate may be applied to each of the above conditions, and the input means that maximizes the character string input efficiency may be selected.

【0027】[0027]

【発明の効果】以上、詳細に説明したように、本発明
は、入力された文字イメージについて文字認識率と正解
文字候補包含率を推定し、文字列イメージデータを文字
コードに変換する複数の手段の内、変換処理に要する時
間が最短となる手段を選択するようにしたので、入力文
字の字体変動、品質に対応した入力効率の高い適切な入
力方法を機械的に選択することが可能な文字列入力方法
およびその装置を実現できるという顕著な効果を奏する
ものである。
As described above in detail, the present invention estimates a character recognition rate and a correct answer candidate inclusion rate for an input character image, and converts a plurality of character string image data into character codes. Among these, the method that minimizes the time required for conversion processing is selected, so it is possible to mechanically select an appropriate input method with high input efficiency that corresponds to the font variation and quality of input characters. This has the remarkable effect of realizing the column input method and its apparatus.

【0028】また、複数の文字認識アルゴリズムによる
文字認識結果の一致度から文字認識率を推定し、類似パ
タン文字候補が文字認識結果中に含まれる程度から正解
文字候補包含率を推定するようにした場合、あるいは、
予め各変換手段について、変換処理に要する時間の観測
により、各変換手段の優劣が逆転する文字認識率および
正解文字候補包含率の規定値を求めておいて、推定結果
と比較して各変換手段の優劣を判断し、変換処理に要す
る時間が最短となる変換手段を選択するようにした場合
には、特に、入力文字の字体変動、品質に対応した入力
効率の高い適切な入力方法を機械的に選択することが可
能な文字列入力方法を容易に実現することができる。
Further, the character recognition rate is estimated from the degree of coincidence of the character recognition results obtained by a plurality of character recognition algorithms, and the correct character candidate inclusion rate is estimated from the degree to which similar pattern character candidates are included in the character recognition results. If or
For each conversion means, by observing the time required for the conversion processing, the prescribed values of the character recognition rate and the correct character candidate inclusion rate at which the superiority or inferiority of each conversion means reverses are obtained, and each conversion means is compared with the estimation result. When selecting the conversion method that determines the time required for the conversion process by determining the superiority or inferiority of the It is possible to easily realize a character string input method that can be selected.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示す文字列入力方法の処理
ブロックを説明する図である。
FIG. 1 is a diagram illustrating processing blocks of a character string input method according to an embodiment of the present invention.

【図2】上記実施例における入力される文字の品質と文
字認識率および正解文字包含率との関係を説明するため
の図である。
FIG. 2 is a diagram for explaining the relationship between the quality of input characters, the character recognition rate, and the correct answer character inclusion rate in the above embodiment.

【図3】上記実施例における入力される文字の品質と、
各種の文字列入力手段の相対的な文字列入力効率との関
係を説明するための図である。
FIG. 3 shows the quality of input characters in the above embodiment,
It is a figure for demonstrating the relationship with the relative character string input efficiency of various character string input means.

【図4】上記実施例による文字列入力効率を説明する図
である。
FIG. 4 is a diagram illustrating character string input efficiency according to the above embodiment.

【図5】上記実施例における文字品質評価処理ブロック
の詳細を説明するための図である。
FIG. 5 is a diagram for explaining details of a character quality evaluation processing block in the embodiment.

【符号の説明】[Explanation of symbols]

101…文字品質評価処理ブロック 102、103、104…文字列入力を行うための入力
手段 201…入力文字品質に対する文字認識率 202…入力文字品質に対する正解文字候補のn位まで
の包含率(正解文字候補包含率) 301…文字列をキーボードから直接入力する場合の入
力効率 302…文字認識および単語辞書との突き合わせを想定
した文字列入力手段の相対的な文字列入力効率 401…入力手段3種の文字列入力効率のそれぞれ最大
となる領域を統合した入力効率 501…文字認識率を推定する処理ブロック 502…正解文字候補包含率を推定する処理ブロック 503…文字列入力効率が最大となる入力手段を選択す
る処理ブロック
101 ... Character quality evaluation processing block 102, 103, 104 ... Input means for inputting character string 201 ... Character recognition rate for input character quality 202 ... Inclusion rate (correct answer character) up to the nth position of correct answer candidate for input character quality Candidate inclusion ratio) 301 ... Input efficiency when a character string is directly input from a keyboard 302 ... Relative character string input efficiency of a character string input means assuming character recognition and matching with a word dictionary 401 ... Of three kinds of input means Input efficiency that integrates areas of maximum character string input efficiency 501 ... Processing block for estimating character recognition rate 502 ... Processing block for estimating correct character candidate inclusion rate 503 ... Input means for maximizing character string input efficiency Processing block to select

フロントページの続き (72)発明者 木村 義政 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内 (72)発明者 倉掛 正治 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内Front Page Continuation (72) Inventor Yoshimasa Kimura 1-1-6 Uchisaiwaicho, Chiyoda-ku, Tokyo Nihon Telegraph and Telephone Corp. (72) Shoji Kurakake 1-1-6 Uchiyuki-cho, Chiyoda-ku, Tokyo Nihon Telegraph Phone Co., Ltd.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 文字イメージデータを文字コードに変換
する処理において、 入力された文字イメージデータについて、文字認識を行
った場合の第1位文字候補の正解率すなわち文字認識率
と正解文字候補が第n位までの文字候補中に含まれる率
すなわち正解文字候補包含率とを推定する段階と、 前記推定した文字認識率および正解文字候補包含率の推
定結果に基づいて、文字列イメージデータを文字コード
に変換する複数の変換手段の内、前記変換処理に要する
時間が最短となる変換手段を選択する段階と、 を有することを特徴とする文字列入力方法。
1. In the process of converting character image data into a character code, the correct answer rate of the first-ranked character candidates, that is, the character recognition rate and the correct answer character candidate, when the character recognition is performed on the input character image data, is first. Based on the step of estimating the rate included in the character candidates up to the nth position, that is, the correct character candidate inclusion rate, and the character string image data is converted into a character code based on the estimated result of the character recognition rate and the correct character candidate inclusion rate. And a step of selecting a conversion means that minimizes the time required for the conversion processing from among a plurality of conversion means for converting into a character string input method.
【請求項2】 入力された文字イメージデータについて
文字認識率と正解文字候補包含率を推定する段階は、 複数の文字認識アルゴリズムによる文字認識結果の第1
位文字候補の一致度から文字認識率を推定する過程と、 認識する各文字について類似パタンとなる文字候補の集
合を定めておき前記類似パタン文字候補が実際の文字認
識結果中に含まれている程度を観測して正解文字候補包
含率を推定する過程と、 を有することを特徴とする請求項1記載の文字列入力方
法。
2. The step of estimating the character recognition rate and the correct answer candidate inclusion rate for the input character image data is the first step of character recognition results by a plurality of character recognition algorithms.
The process of estimating the character recognition rate from the degree of matching of the character candidates and the set of character candidates that are similar patterns for each character to be recognized are defined, and the similar pattern character candidates are included in the actual character recognition result. 2. The method of inputting a character string according to claim 1, further comprising:
【請求項3】 推定した文字認識率および正解文字候補
包含率の推定結果に基づいて、文字列イメージデータを
文字コードに変換する複数の変換手段の内、前記変換処
理に要する時間が最短となる変換手段を選択する段階
は、 予め各変換手段について、文字認識率および正解文字候
補包含率と変換処理に要する時間との関係を観測し、各
変換手段の優劣が逆転する文字認識率および正解文字候
補包含率の規定値を求めておく過程と、 前記推定した文字認識率および正解文字候補包含率の推
定結果の値と前記規定値を比較して各変換手段の優劣を
判断することにより、変換処理に要する時間が最短とな
る変換手段を選択する過程と、 を有することを特徴とする請求項1または請求項2記載
の文字列入力方法。
3. The time required for the conversion process is the shortest among a plurality of conversion means for converting the character string image data into a character code based on the estimated results of the estimated character recognition rate and the correct answer candidate inclusion rate. In the step of selecting the conversion means, the relationship between the character recognition rate and the correct answer candidate inclusion rate and the time required for the conversion process is observed for each conversion means in advance, and the character recognition rate and the correct character in which the superiority and inferiority of each conversion means reverses. The process of obtaining the specified value of the candidate coverage, and by comparing the estimated character recognition rate and the value of the estimation result of the correct answer character candidate coverage and the specified value to determine the superiority or inferiority of each conversion means, the conversion The character string input method according to claim 1 or 2, further comprising: a step of selecting a converting means that minimizes a processing time.
【請求項4】 文字イメージデータを文字コードに変換
する装置において、 入力された文字イメージデータについて、文字認識を行
った場合の第1位文字候補の正解率すなわち文字認識率
を推定する手段と、 前記文字認識における正解文字候補が第n位までの文字
候補中に含まれる率すなわち正解文字候補包含率を推定
する手段と、 前記推定した文字認識率および正解文字候補包含率の推
定結果に基づいて、文字列イメージデータを文字コード
に変換する複数の変換手段の内、前記変換処理に要する
時間が最短となる変換手段を選択する手段と、 を備えることを特徴とする文字列入力装置。
4. An apparatus for converting character image data into a character code, and means for estimating a correct answer rate, that is, a character recognition rate of a first-ranked character candidate when character recognition is performed on input character image data, Based on a means for estimating a rate of correct character candidates included in the character candidates up to the nth position in the character recognition, that is, a correct character candidate inclusion rate, and an estimated result of the estimated character recognition rate and correct character candidate inclusion rate. A character string input device comprising: a plurality of converting means for converting the character string image data into a character code; and a means for selecting a converting means that minimizes the time required for the conversion processing.
JP7159037A 1995-06-26 1995-06-26 Method and device for inputting character string Pending JPH096921A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7159037A JPH096921A (en) 1995-06-26 1995-06-26 Method and device for inputting character string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7159037A JPH096921A (en) 1995-06-26 1995-06-26 Method and device for inputting character string

Publications (1)

Publication Number Publication Date
JPH096921A true JPH096921A (en) 1997-01-10

Family

ID=15684871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7159037A Pending JPH096921A (en) 1995-06-26 1995-06-26 Method and device for inputting character string

Country Status (1)

Country Link
JP (1) JPH096921A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045178A (en) * 2011-08-22 2013-03-04 Fujitsu Ltd Image processing apparatus, image processing method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045178A (en) * 2011-08-22 2013-03-04 Fujitsu Ltd Image processing apparatus, image processing method, and program

Similar Documents

Publication Publication Date Title
US4153897A (en) Method and device for detecting the similarity between standard and unknown patterns
JP4607633B2 (en) Character direction identification device, image forming apparatus, program, storage medium, and character direction identification method
JP2940496B2 (en) Pattern matching encoding apparatus and method
US5835632A (en) Image processing method and an image processing apparatus
US20050226517A1 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
US5909510A (en) Method and apparatus for document classification from degraded images
US4850026A (en) Chinese multifont recognition system based on accumulable stroke features
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JPH06508465A (en) Character recognition system and method using means for measuring endpoint characteristics in a character bitmap
EP0576020B1 (en) Character recognizing method and apparatus
JPH09319829A (en) Online character recognition device
KR100220213B1 (en) Apparatus and method of character recognition based on 0-1 pattern histogram
KR970062956A (en) Character recognition method and device
JPH096921A (en) Method and device for inputting character string
US6526170B1 (en) Character recognition system
KR19980058361A (en) Korean Character Recognition Method and System
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP2000076378A (en) Character recognizing method
JP2001236467A (en) Method and device for pattern recognition, and recording medium with pattern recognition program recorded thereon
EP0625764A2 (en) Accelerated OCR classification
JP2848560B2 (en) Image recognition method and apparatus
JPH1069518A (en) Character recognition method and system therefor
JPH08161432A (en) Method and device for segmenting character
JP3320083B2 (en) Character recognition apparatus and method
US5666440A (en) Method and apparatus for extracting outline data from bi-level image data