JP2003346080A - Character recognition method - Google Patents

Character recognition method

Info

Publication number
JP2003346080A
JP2003346080A JP2002147915A JP2002147915A JP2003346080A JP 2003346080 A JP2003346080 A JP 2003346080A JP 2002147915 A JP2002147915 A JP 2002147915A JP 2002147915 A JP2002147915 A JP 2002147915A JP 2003346080 A JP2003346080 A JP 2003346080A
Authority
JP
Japan
Prior art keywords
character recognition
result
input
character
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002147915A
Other languages
Japanese (ja)
Inventor
Yasuhiro Aoki
泰浩 青木
Bunpei Irie
文平 入江
Hideo Horiuchi
秀雄 堀内
Naoki Natori
直毅 名取
Akihiko Nakao
昭彦 中尾
Takuma Akagi
琢磨 赤木
Tomoyuki Hamamura
倫行 浜村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002147915A priority Critical patent/JP2003346080A/en
Publication of JP2003346080A publication Critical patent/JP2003346080A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a character recognition method making it possible to enhance the overall processing capability of a character recognition system which requires human verification, by making use of the results of character recognition for input images and their certainty. <P>SOLUTION: The method includes performing character recognition for an image on an input form; obtaining similarity as the result of this character recognition; comparing the similarity to the previously registered certainty required of the character recognition; and either providing an output indicating that no human verification is required for the result of the character recognition according to the comparison result, or providing an output urging human verification by presenting candidates for character recognition as options for the result of character recognition according to the comparison result, or providing an output urging manual inputting by presenting a manual new input and a determination for the result of the character recognition according to the comparison result. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、たとえば、帳票上
を光学的に走査して得られる入力画像からの文字認識結
果によって人手によるベリファイを必要とする文字認識
システムにおける文字認識方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method in a character recognition system that requires manual verification based on a character recognition result from an input image obtained by optically scanning a form.

【0002】[0002]

【従来の技術】文字認識の認識精度は、対象が手書き文
字如何にも関わらず、年々精度は向上している。その1
つの要因として学習データセットの充実があげられる
が、さらに言うと、このデータセットを解析する理論的
発展の貢献が大きい。それによれば、他のカテゴリとの
識別性能を上げるためには、ベクトル空間上に分布する
カテゴリごとのベクトル集合において、サポートベクト
ルと呼ばれる、パターン集合の境界周辺に存在するベク
トルを適切に選択することが識別性能の向上に貢献して
いる。この理論的知見は、計算機実験などで確かめられ
ることによって、近年、一般的に認められるようになっ
てきた。
2. Description of the Related Art The accuracy of character recognition is improving year by year, regardless of whether a target is a handwritten character. Part 1
One of the factors is the enrichment of the training data set, and more specifically, the theoretical development of analyzing this data set has made a significant contribution. According to this, in order to improve the discrimination performance with other categories, in a vector set for each category distributed in a vector space, a vector called a support vector, which is present around a boundary of a pattern set, is appropriately selected. Contribute to the improvement of the identification performance. In recent years, this theoretical finding has been generally accepted by being confirmed by computer experiments and the like.

【0003】このような識別性能の向上に伴い、ある文
字画像に対して、「カテゴリ“A”らしい」、「どちら
でもない」といった従来の出力情報から、新たに「極め
てカテゴリ“A”らしい」、「カテゴリ“B”に近い
“A”」、「どちらでもない」の類の詳細な情報提供も
可能となってきた。従来技術は、基本的には正解カテゴ
リとの対応付けしか考慮されておらず、他のカテゴリと
の関係を表した情報や確からしさの取扱いについては曖
昧であった。これは、データセットの解析が充分になさ
れていなかったことに起因する。
[0003] With such an improvement in the discrimination performance, a certain character image is newly changed to "extremely category" A "" from conventional output information such as "category" A "" or "neither". It has also become possible to provide detailed information such as "A near category" B "" or "neither." The prior art basically considers only the association with the correct category, and is ambiguous in handling information indicating the relationship with other categories and certainty. This is due to insufficient analysis of the data set.

【0004】「極めてカテゴリ“A”らしい」というの
は、出現頻度が高く、パターン集合の分布の中心付近に
位置するものと考えられる。このようなパターンの認識
結果については、文字認識世界(高次元ベクトル空間の
世界)と現実世界との同期がとれており、極めて安定し
ている。今後、文字認識技術が進化するにしたがい、こ
のような安定した解を得る集合は益々増えることが予想
される。文字認識技術が広く活用されているとはいえ、
文字認識の誤り率を最小とさせる目的から、人手による
ベリファイを必要とする文字認識システムに、これらの
新規情報を付加して、システムの構成を再構築すること
は非常に有効である。
[0004] It is considered that "very likely to be category" A "" has a high appearance frequency and is located near the center of the distribution of the pattern set. Regarding the recognition result of such a pattern, the character recognition world (the world of the high-dimensional vector space) is synchronized with the real world, and is extremely stable. In the future, as the character recognition technology evolves, the number of sets that can obtain such a stable solution is expected to increase more and more. Although character recognition technology is widely used,
For the purpose of minimizing the error rate of character recognition, it is very effective to add such new information to a character recognition system that requires manual verification and reconstruct the system configuration.

【0005】[0005]

【発明が解決しようとする課題】文字認識システムを用
いることの利点は、文書画像について、そこに何が書か
れているかを高速に、誤りなく、大量に判別させること
にある。このような文字認識シシステムが効果的となる
には、人手による処理能力よりも優れていることが保証
されていなくてはならない。ここで、処理能力につい
て、人間と文字認識システムとの比較を行なうために、
処理能力を以下の基本式で評価する。
An advantage of using a character recognition system is that a document image can be identified in a large number at high speed without errors and with high accuracy. For such a character recognition system to be effective, it must be guaranteed that it is superior to manual processing. Here, in order to compare the human and character recognition systems in terms of processing capacity,
The processing capacity is evaluated by the following basic formula.

【0006】能力=速度(平均)×精度(平均) 文字認識は、処理速度に関しては圧倒的に勝っている
が、精度が常に問題となる。通常は、個別文字当たり9
9.0%以上の精度を要求される。高精度(誤り率最
小)を要求されるシステムを運用する場合、文字認識の
平均精度が未達の場合、および、単語認識のように大量
の文字認識列を扱う場合には、人手によるベリファイを
必要とする。
Ability = speed (average) × precision (average) Although character recognition is overwhelmingly superior in processing speed, accuracy always matters. Normally, 9 characters per individual character
Accuracy of 9.0% or more is required. When operating a system that requires high accuracy (minimum error rate), when the average accuracy of character recognition is not reached, and when handling a large amount of character recognition strings such as word recognition, manual verification is required. I need.

【0007】本発明では、このような人手によるベリフ
ァイを必要とするシステムを前提として、文字認識精度
が調整可能となった場合の文字認識システムの設計方法
について、上記基本式を 能力=α(速度1×精度)+β(速度2×精度)+γ
(速度3×精度)(α+β+γ=1、速度1>速度2>
>速度3) として提案する。ここで、右辺の第1、第2、第3項を
それぞれ、「文字認識の処理能力」、「文字認識出力を
確認する作業だけの処理能力」、「完全な人手による処
理能力」とする(速度1、速度2、速度3についても同
様に対応する)。文字認識精度を調整可能とした場合に
は、条件に応じて適切に分配させてやることにより、誤
りを最小にしつつ、処理能力を最大限に向上させること
が可能となる。
In the present invention, on the premise of such a system that requires manual verification, a method for designing a character recognition system in which the character recognition accuracy can be adjusted is represented by the above-mentioned basic formula, where the capability = α (speed 1 x accuracy) + β (speed 2 x accuracy) + γ
(Speed 3 × Accuracy) (α + β + γ = 1, Speed 1> Speed 2>
> Speed 3) Here, the first, second, and third terms on the right-hand side are referred to as “character recognition processing capability”, “processing capability only for checking character recognition output”, and “complete manual processing capability”, respectively ( The same applies to speed 1, speed 2, and speed 3). If the character recognition accuracy can be adjusted, it is possible to improve the processing capability to the maximum while minimizing errors by appropriately distributing according to the conditions.

【0008】このような考え方は、従来型の「アクセプ
ト−リジェクト」判別結果に基づくベリファイとは異な
る。たとえば、認識精度を調整することにより、ある文
字画像について「絶対“A”です」、「“A”か“B”
か“C”だと思います」、「全くわかりません」と出力
結果を細分化させることは、人手による最終選択を委ね
ているものの、その判断のレベルにおいて処理速度や精
度に格差が生じるため、これらを最適に分配させてやる
ことにより、システム全体の処理能力を向上させること
を容易に想像できる。
This concept is different from the conventional verification based on the result of the “accept-reject” determination. For example, by adjusting the recognition accuracy, for a certain character image, "Absolute" A "", "A" or "B"
I think that it is "C" or "I don't know at all". Although subdividing the output result leaves the final selection by hand, there is a difference in processing speed and accuracy at the level of judgment. It can be easily imagined that the processing capacity of the whole system is improved by distributing these optimally.

【0009】文字認識手法が高精度になるにしたがい、
パターン集合の特徴ベクトル空間上での分布解析も同様
に進む。この事実は、従来まで愛昧だった部分集合の詳
細な解析が進むにつれ、結果として確信をもって解析で
きたとされる部分集合が増えることを意味する。このよ
うな性質をもった部分集合を測る目的で確信度を導入す
れば、文字認識結果の類似度および候補文字列との対応
関係を参照しつつ、それらのベリファイ作業は「確定さ
れたもの」、「選択問題」および「自由記述問題」とい
った分類を可能にする。具体的には「キー入力なし」、
「矢印&リターンキー」、「通常キーボード入力」と代
表的な3つの作業へと分類させることに相当する。これ
より、画像一通当たりにかかる処理速度、処理精度共に
向上させる。
As the character recognition method becomes more accurate,
The analysis of the distribution of the pattern set in the feature vector space proceeds similarly. This fact means that as the detailed analysis of the subset that has been loved until now progresses, the number of subsets that can be analyzed with certainty increases as a result. If confidence is introduced for the purpose of measuring subsets with such properties, their verification work is "determined" while referring to the similarity of character recognition results and the correspondence with candidate character strings. , "Choice questions" and "free writing questions". Specifically, "No key input",
This corresponds to the classification into three typical tasks of “arrow & return key” and “normal keyboard input”. Thereby, both the processing speed and the processing accuracy per one image are improved.

【0010】そこで、本発明は、人手によるベリファイ
を必要とする文字認識システムにおいて、入力画像の文
字認識結果とその確信度を活用することにより、全体の
処理能力を向上させることを可能とする文字認識方法を
提供することを目的とする。
Therefore, the present invention provides a character recognition system which requires a manual verification to utilize a character recognition result of an input image and its certainty factor to improve the overall processing performance. It is intended to provide a recognition method.

【0011】[0011]

【課題を解決するための手段】本発明の文字認識方法
は、文字が記載されている帳票上の画像を入力する第1
のステップと、この第1のステップにより入力された入
力画像に対し文字認識を行ない、その文字認識結果とし
ての類似度を得る第2のステップと、この第2のステッ
プにより得られた類似度と、あらかじめ登録された当該
文字認識に要求する確信度とを比較する第3のステップ
と、この第3のステップによる比較の結果に基づき、前
記文字認識結果に対し人手によるベリファイ処理を必要
としない出力、前記文字認識結果に対し文字認識候補の
選択肢を提示して人手によるベリファイ処理を促す出
力、あるいは、前記文字認識結果に対し人手による新規
入力および確定を提示して手入力処理を促す出力のいず
れかを行なう第4のステップとを具備している。
According to the character recognition method of the present invention, a first method for inputting an image on a form on which characters are described is provided.
A second step of performing character recognition on the input image input in the first step to obtain a similarity as a result of the character recognition, and a similarity degree obtained in the second step. A third step of comparing a certainty factor required for the character recognition registered in advance, and an output which does not require a manual verification process on the character recognition result based on a result of the comparison in the third step. An output for presenting a character recognition candidate option to the character recognition result to prompt a manual verification process, or an output for prompting a manual input process by presenting a new manual input and confirmation to the character recognition result. And performing a fourth step.

【0012】また、本発明の文字認識方法は、所定のフ
ォームで文字が記載されている帳票上の画像を入力する
第1のステップと、この第1のステップにより入力され
た入力画像により前記帳票上のフォームを識別する第2
のステップと、この第2のステップにより識別された当
該帳票のフォームがあらかじめ登録されているか否かを
判定する第3のステップと、この第3のステップによる
判定の結果、当該帳票のフォームがあらかじめ登録され
ていなかった場合、当該フォームおよび当該フォームの
文字認識に要求する確信度を登録する第4のステップ
と、前記第3のステップによる判定の結果、当該帳票の
フォームがあらかじめ登録されている場合、その登録さ
れているフォームに基づき前記第1のステップにより入
力された入力画像に対し文字認識を行ない、その文字認
識結果としての類似度を得る第5のステップと、この第
5のステップにより得られた類似度と前記あらかじめ登
録された確信度とを比較する第6のステップと、この第
6のステップによる比較の結果に基づき、前記文字認識
結果に対し人手によるベリファイ処理を必要としない出
力、前記文字認識結果に対し文字認識候補の選択肢を提
示して人手によるベリファイ処理を促す出力、あるい
は、前記文字認識結果に対し人手による新規入力および
確定を提示して手入力処理を促す出力のいずれかを行な
う第7のステップとを具備している。
Further, the character recognition method of the present invention includes a first step of inputting an image on a form in which characters are described in a predetermined form, and the form using the input image input in the first step. Second identifying form above
And a third step of determining whether or not the form of the form identified in the second step is registered in advance. As a result of the determination in the third step, the form of the form is If the form has not been registered, the fourth step of registering the form and the degree of certainty required for character recognition of the form, and the result of the determination in the third step indicates that the form of the form has been registered in advance. A fifth step of performing character recognition on the input image input in the first step on the basis of the registered form and obtaining a similarity as a result of the character recognition; A sixth step of comparing the obtained similarity with the previously registered certainty factor; and An output that does not require manual verification processing on the character recognition result based on the result of the comparison, an output that presents options of character recognition candidates for the character recognition result and prompts manual verification processing, or the character recognition result. A seventh step of performing any one of an output prompting a manual input process by presenting a new input by a user and a determination with respect to the result.

【0013】[0013]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は、本実施の形態に係
る文字認識システムの構成を概略的に示すものである。
図1において、読取部11は、被読取物としての帳票H
上の画像を読取るもので、たとえば、光学的な走査によ
り帳票H上の画像を読取り、デジタル画像データとして
入力するスキャナなどにより構成されている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 schematically shows a configuration of a character recognition system according to the present embodiment.
In FIG. 1, a reading unit 11 includes a form H as an object to be read.
The scanner reads an image on the form H, and is configured by, for example, a scanner that reads an image on the form H by optical scanning and inputs the image as digital image data.

【0014】帳票Hは、たとえば、図2に示すように、
所定のフォームで文字が記載されている。すなわち、こ
の例では、住所が記載される住所欄(領域)C1、氏名
が記載される氏名欄(領域)C2、年齢が記載される年
齢欄(領域)C3、および、職業が記載される職業欄
(領域)C4がそれぞれ設けられていて、これら各欄C
1〜C4内の各文字を認識するようになっている。
The form H is, for example, as shown in FIG.
Characters are described in a predetermined form. That is, in this example, an address field (area) C1 in which an address is described, a name field (area) C2 in which a name is described, an age field (area) C3 in which an age is described, and an occupation in which an occupation is described Columns (areas) C4 are provided, and these columns C
Each character in 1 to C4 is recognized.

【0015】読取部11から出力される画像データは、
フォーム識別部12へ送られる。フォーム識別部12
は、読取部11から出力される画像データに基づき帳票
Hのフォームを識別し、その識別結果を制御部13へ送
る。制御部13は、全体的な制御や各種処理を行なうも
ので、これには操作部14およびフォームデータベース
15が接続されている。
The image data output from the reading unit 11 is
Sent to form identification unit 12. Form identification unit 12
Identifies the form of the form H based on the image data output from the reading unit 11, and sends the identification result to the control unit 13. The control unit 13 performs overall control and various processes, and an operation unit 14 and a form database 15 are connected to the control unit 13.

【0016】操作部14は、各種操作やデータ入力を行
なうためのキーボードなどの操作キー、および、各種案
内や入出力データの表示を行なう表示部などから構成さ
れている。フォームデータベース15は、本システムに
て取扱う帳票Hのフォームが登録設定される。すなわ
ち、たとえば、図3に示すように、フォームの種類を示
すフォーム番号、当該フォームの文字認識に用いる文字
辞書の種類、当該フォームの各欄C1〜C4の位置(座
標値)および項目名、当該欄の文字認識に要求する確信
度(P)がそれぞれ登録設定される。
The operation unit 14 includes operation keys such as a keyboard for performing various operations and data input, and a display unit for displaying various guidance and input / output data. In the form database 15, the form of the form H handled by this system is registered and set. That is, for example, as shown in FIG. 3, a form number indicating a type of a form, a type of a character dictionary used for character recognition of the form, positions (coordinate values) and item names of columns C1 to C4 of the form, and The degree of certainty (P) required for character recognition in the column is registered and set.

【0017】また、読取部11から出力される画像デー
タは、文字認識部16へ送られる。文字認識部16は、
制御部13から送られる当該帳票Hのフォームデータに
基づき、読取部11から出力される画像データにより文
字認識を行ない、その認識結果を出力する。この文字認
識については後で詳細を説明する。
The image data output from the reading unit 11 is sent to a character recognition unit 16. The character recognition unit 16
Based on the form data of the form H sent from the control unit 13, character recognition is performed by the image data output from the reading unit 11, and the recognition result is output. This character recognition will be described later in detail.

【0018】次に、このような構成において図4〜図6
に示すフローチャートを参照しつつ文字認識処理の流れ
について説明する。帳票Hを読取部11にセットし、帳
票H上の画像を入力する(ステップS1)。この入力さ
れた帳票H上の画像はフォーム識別部12へ送られる。
フォーム識別部12は、前述したように帳票Hのフォー
ムを識別し(ステップS2)、その識別結果を制御部1
3へ送る。制御部13は、フォーム識別部12からの識
別結果に基づき、識別された当該帳票Hのフォームがフ
ォームデータベース15に登録されているか否かをチェ
ックする(ステップS3)。
Next, in such a configuration, FIGS.
The flow of the character recognition process will be described with reference to the flowchart shown in FIG. The form H is set on the reading unit 11, and an image on the form H is input (step S1). The input image on the form H is sent to the form identification unit 12.
The form identification unit 12 identifies the form of the form H as described above (step S2), and outputs the identification result to the control unit 1
Send to 3. The control unit 13 checks whether or not the identified form of the form H is registered in the form database 15 based on the identification result from the form identification unit 12 (step S3).

【0019】このチェックの結果、当該帳票Hのフォー
ムがフォームデータベース15に登録されていない場
合、当該帳票Hのフォーム識別結果に基づきフォームデ
ータベース15に登録を行なう。すなわち、まず、当該
フォームの文字認識に用いる文字辞書の種類を選択する
(ステップS4)。次に、住所欄C1の位置(座標値)
を設定する(ステップS5)。次に、住所欄C1の項目
名を設定する(ステップS6)。次に、住所欄C1の文
字認識に要求する確信度(P1)を設定する(ステップ
S7)。次に、次の欄があるか否かをチェックし(ステ
ップS8)、この例の場合、まだ欄があるのでステップ
S5に戻って、次の氏名欄C2に対する設定処理を繰り
返す。
As a result of this check, if the form of the form H is not registered in the form database 15, the form is registered in the form database 15 based on the form identification result of the form H. That is, first, the type of character dictionary used for character recognition of the form is selected (step S4). Next, the position (coordinate value) of the address column C1
Is set (step S5). Next, the item name of the address column C1 is set (step S6). Next, a certainty factor (P1) required for character recognition of the address column C1 is set (step S7). Next, it is checked whether or not there is a next column (step S8). In this example, since there is still a column, the process returns to step S5, and the setting process for the next name column C2 is repeated.

【0020】そして、最終欄である職業欄C4に対する
設定処理が終了すると、先の各設定内容に基づき所定の
演算を行なうことにより本システムの処理能力を求め、
この求めた処理能力を操作部14に表示する(ステップ
S9)。オペレータは、操作部14の表示内容を目視し
て、求めた処理能力でよいか否かを判断する(ステップ
S10)。
When the setting process for the occupation column C4, which is the last column, is completed, the processing capability of the present system is obtained by performing a predetermined calculation based on the above-described settings.
The obtained processing capacity is displayed on the operation unit 14 (step S9). The operator visually checks the display content of the operation unit 14 and determines whether or not the obtained processing capability is sufficient (step S10).

【0021】ステップS10の判断の結果、求めた処理
能力に許可できない場合、操作部14でその旨を指示す
ることにより、ステップS5に戻って設定処理をやり直
す。ステップS10の判断の結果、求めた処理能力を許
可できる場合、操作部14でその旨を指示することによ
り、ステップS4〜S7にて設定した設定内容を、図3
に示したようにフォームデータベース15に登録し(ス
テップS11)、その後、ステップS1に戻って認識処
理を最初からやり直す。
As a result of the determination in step S10, if the requested processing capability cannot be permitted, the operation unit 14 instructs the fact, and returns to step S5 to repeat the setting process. As a result of the determination in step S10, if the obtained processing capability can be permitted, the setting is set in steps S4 to S7 by instructing the operation unit 14 to that effect.
Is registered in the form database 15 (step S11), and then the process returns to step S1 to start the recognition process again from the beginning.

【0022】ステップS3のチェックの結果、当該帳票
Hのフォームがフォームデータベース15に登録されて
いる場合、当該帳票Hのフォーム識別結果に対応するフ
ォームデータをフォームデータベース15から取得し
(ステップS12)、この取得したフォームデータを文
字認識部16に送ることにより、当該フォームデータに
基づく文字認識を行なう。
As a result of the check in step S3, if the form of the form H is registered in the form database 15, the form data corresponding to the form identification result of the form H is obtained from the form database 15 (step S12). By transmitting the obtained form data to the character recognition unit 16, character recognition based on the form data is performed.

【0023】すなわち、まず、取得したフォームデータ
に基づき、読取部11で入力された帳票H上の画像か
ら、文字認識する欄C1〜C4の各文字画像領域を分割
する(ステップS13)。次に、この分割した各文字画
像領域に対して、当該フォームに登録された文字辞書を
用いて文字認識を行ない、その認識結果として類似度を
出力する(ステップS14)。この文字認識は、この例
の場合、住所欄C1から順次行なうものとする。
First, based on the acquired form data, the character image areas of the character recognition columns C1 to C4 are divided from the image on the form H input by the reading unit 11 (step S13). Next, character recognition is performed on each of the divided character image regions using a character dictionary registered in the form, and a similarity is output as the recognition result (step S14). In this example, the character recognition is performed sequentially from the address column C1.

【0024】次に、住所欄C1の確信度P1とステップ
S14で得られた住所欄C1の類似度S1を比較し(ス
テップS15)、[P1≦S1]であれば、確信度が高
いと見做して人手によるベリファイ処理を必要としない
文字認識確定処理とする(ステップS16)。すなわ
ち、この場合、当該類似度S1を最終的な文字認識結果
として確定し、確定した文字認識結果を操作部14に表
示する。この場合、確信度が高くベリファイを必要とし
ないので、高速に次の文字画像の表示に移る。そのた
め、オペレータはこの文字画像の認識結果についてはほ
とんど意識する必要がない。また、文字認識確定処理と
した場合、図7に示す処理状況テーブル17の住所欄C
1の文字認識確定処理数Cを「+1」する。
Next, the degree of certainty P1 of the address field C1 is compared with the degree of similarity S1 of the address field C1 obtained in step S14 (step S15). If [P1 ≦ S1], it is determined that the degree of certainty is high. It is assumed that the character recognition determination processing does not require the manual verification processing (step S16). That is, in this case, the similarity S1 is determined as the final character recognition result, and the determined character recognition result is displayed on the operation unit 14. In this case, since the degree of certainty is high and verification is not required, the display proceeds to the next character image at high speed. Therefore, the operator hardly needs to be aware of the recognition result of the character image. When the character recognition determination process is performed, the address column C of the processing status table 17 shown in FIG.
The number C of character recognition confirmation processes of 1 is incremented by "+1".

【0025】ステップS15の比較の結果、[P1>S
1≧P1−5%]であれば、人手によるベリファイ処理
を必要とするベリファイ処理とする(ステップS1
7)。すなわち、この場合、人手による選択、確定を必
要とするので、図8(a)に示すように、当該文字画像
について、現在の文字位置を示すよう強調された表示を
操作部14に行なう。また、同時に、図8(b)に示す
ように、どの文字候補が選択肢としてあげられているか
を表示し、デフォルト確定を1位候補として表示する。
オペレータは一目見てデフォルト値で問題なければ、そ
のまま確定入力操作を行なうこととなる。また、ベリフ
ァイ処理とした場合、図7に示す処理状況テーブル17
の住所欄C1のベリファイ処理数Vを「+1」する。
As a result of the comparison in step S15, [P1> S
If 1 ≧ P1-5%], the verification processing requires manual verification processing (step S1).
7). That is, in this case, since manual selection and confirmation are required, as shown in FIG. 8A, a highlighted display indicating the current character position is performed on the operation unit 14 for the character image. At the same time, as shown in FIG. 8B, which character candidate is listed as an option is displayed, and the default determination is displayed as the first candidate.
At first glance, if there is no problem with the default value, the operator performs the fixed input operation as it is. When the verification processing is performed, the processing status table 17 shown in FIG.
The number of verify processings V in the address column C1 is set to “+1”.

【0026】ステップS15の比較の結果、[S1<P
1−5%]であれば、当該類似度S1の値に関係なく人
手による新規入力および確定を必要とする手入力処理と
する(ステップS18)。すなわち、この場合、人手に
よる新規入力を必要とするので、当該文字画像につい
て、上記同様に現在の文字位置を示すよう強調された表
示を操作部14に行ない、今度は選択肢は表示はするも
のの、基本的には新規入力画面を同時に表示する。ま
た、手入力処理とした場合、図7に示す処理状況テーブ
ル17の住所欄C1の手入力処理数Iを「+1」する。
As a result of the comparison in step S15, [S1 <P
1-5%], a manual input process that requires a new manual input and confirmation is performed regardless of the value of the similarity S1 (step S18). That is, in this case, since a new input by hand is required, the character image is highlighted on the operation unit 14 so as to indicate the current character position in the same manner as described above. Basically, a new input screen is displayed at the same time. In the case of manual input processing, the number I of manual input processing in the address column C1 of the processing status table 17 shown in FIG. 7 is set to “+1”.

【0027】次に、認識処理欄を1つ進め(ステップS
19)、全ての欄が終了したか否かをチェックし(ステ
ップS20)、全ての欄が終了していなければ、ステッ
プS14に戻って次の欄(氏名欄C2)に対する文字認
識処理を行なう。
Next, the recognition processing section is advanced by one (step S).
19) It is checked whether or not all the fields have been completed (step S20). If not all the fields have been completed, the process returns to step S14 to perform the character recognition processing for the next field (name field C2).

【0028】なお、図7に示した処理状況テーブル17
は制御部13内に設けられていて、各欄C1〜C4ごと
に一定期間内の文字認識確定処理数C、ベリファイ処理
数V、手入力処理数Iがそれぞれ格納される。図7の例
は、期間が10日間で、帳票を1000通処理した場合
を示している。
The processing status table 17 shown in FIG.
Is provided in the control unit 13, and stores the number C of character recognition confirmation processing, the number V of verification processing, and the number I of manual input processing within a fixed period for each of the columns C1 to C4. The example of FIG. 7 illustrates a case where the period is 10 days and 1000 forms are processed.

【0029】ステップS20のチェックの結果、全ての
欄が終了していれば、全ての欄が文字認識確定処理であ
ったか否かをチェックする(ステップS21)。このチ
ェックの結果、全ての欄が文字認識確定処理であった場
合、当該帳票Hに対して文字認識確定区分という判定結
果を出力し(ステップS22)、ステップS23に進
む。
As a result of the check in step S20, if all the columns are completed, it is checked whether or not all the columns have been subjected to character recognition determination processing (step S21). As a result of this check, when all the fields are the character recognition confirmation processing, a determination result of the character recognition confirmation classification is output to the form H (step S22), and the process proceeds to step S23.

【0030】ステップS21のチェックの結果、全ての
欄が文字認識確定処理でなかった場合、手入力処理があ
ったか否かをチェックする(ステップS24)。このチ
ェックの結果、手入力処理があった場合、当該帳票Hに
対して手入力区分という判定結果を出力し(ステップS
25)、ステップS23に進む。
If the result of the check in step S21 is that all the fields have not been subjected to character recognition confirmation processing, it is checked whether or not manual input processing has been performed (step S24). As a result of this check, if there is a manual input process, a determination result of a manual input category is output to the form H (step S).
25), and proceed to step S23.

【0031】ステップS24のチェックの結果、手入力
処理がなかった場合、当該帳票Hに対してベリファイ区
分という判定結果を出力し(ステップS26)、ステッ
プS23に進む。
If the result of the check in the step S24 shows that there is no manual input process, a judgment result of the verifying section is output to the form H (step S26), and the process proceeds to a step S23.

【0032】ステップS23は、処理状況テーブル17
を参照することにより、各欄C1〜C4ごとに、帳票の
処理数に対する手入力処理数Iの比率を求める。具体的
には、図7の期間が4月1日〜4月10日までの例によ
れば、住所欄C1の手入力処理数Iの比率は100/4
000(=2.5%)、氏名欄C2の手入力処理数Iの
比率は50/4000(=1.25%)、年齢欄C3の
手入力処理数Iの比率は50/4000(=1.25
%)、職業欄C4の手入力処理数Iの比率は10/40
00(=0.25%)となる。
In step S23, the processing status table 17
, The ratio of the number of manually input processes I to the number of processed forms is calculated for each of the columns C1 to C4. Specifically, according to the example in which the period of FIG. 7 is from April 1 to April 10, the ratio of the number of manually input processes I in the address column C1 is 100/4.
000 (= 2.5%), the ratio of the number of manually input processes I in the name column C2 is 50/4000 (= 1.25%), and the ratio of the number of manually input processes I in the age column C3 is 50/4000 (= 1). .25
%), And the ratio of the number of manually input processes I in the occupation column C4 is 10/40.
00 (= 0.25%).

【0033】次に、求めた手入力処理数Iの比率があら
かじめ設定される所定値(たとえば、10%)以上か否
かをチェックする。このチェックの結果、求めた手入力
処理数Iの比率が所定値以上でなければ、ステップS1
に戻って次の帳票に対する文字認識処理を開始し、所定
値以上であれば操作部14に異常警告を出力し(ステッ
プS27)、その後、ステップS1に戻って次の帳票に
対する文字認識処理を開始する。
Next, it is checked whether or not the ratio of the calculated number of manual input processes I is equal to or greater than a predetermined value (for example, 10%). As a result of this check, if the calculated ratio of the number I of manual input processing is not equal to or greater than the predetermined value, the process proceeds to step S1.
To start the character recognition process for the next document, and if it is equal to or more than the predetermined value, output an abnormality warning to the operation unit 14 (step S27). Then, return to step S1 to start the character recognition process for the next document. I do.

【0034】なお、ステップS22で出力される文字認
識確定区分、ステップS25で出力される手入力区分、
ステップS26で出力されるベリファイ区分、の各判定
結果は、当該帳票の区分処理などに用いられる。
Note that the character recognition decision section output in step S22, the manual input section output in step S25,
Each determination result of the verification classification output in step S26 is used for the classification processing of the form.

【0035】また、本システムの能力を判定し、確信度
の再設定などを行なうことができる。すなわち、本シス
テムの能力を判定する場合、操作部14に設けられた能
力判定ボタン(図示しない)を押下する。すると、制御
部13は、処理状況テーブル17を参照することによ
り、帳票の処理数に対する各欄合計の文字認識確定処理
数C、ベリファイ処理数V、手入力処理数Iの各比率を
求める。
Further, it is possible to judge the capability of the present system and reset the certainty factor. That is, when determining the capability of the present system, a capability determination button (not shown) provided on the operation unit 14 is pressed. Then, the control unit 13 refers to the processing status table 17 to obtain the ratio of the total number of character recognition determination processes C, the number of verification processes V, and the number of manual input processes I of the total of each column to the number of forms processed.

【0036】具体的には、図7の期間が4月1日〜4月
10日までの例によれば、各欄合計の文字認識確定処理
数Cの比率は3500/4000(=87.5%)、各
欄合計のベリファイ処理数Vの比率は290/4000
(=7.25%)、各欄合計の手入力処理数Iの比率は
210/4000(=5.25%)となる。
More specifically, according to the example in which the period of FIG. 7 is from April 1 to April 10, the ratio of the number of character recognition confirmed processes C of the total of each column is 3500/4000 (= 87.5). %), And the ratio of the total number of verify processes V in each column is 290/4000.
(= 7.25%), the ratio of the number of manually input processes I in each column is 210/4000 (= 5.25%).

【0037】また、各欄C1〜C4ごとに、帳票の処理
数に対する手入力処理数Iの比率を求める。これは前述
したステップS23での処理と同様な処理で求めること
ができる。こうして求めた各比率は操作部14に表示さ
れる。ここで、オペレータは、操作部14に表示された
内容に基づき、各欄C1〜C4に対する確信度の再設定
などを行なう。
Further, the ratio of the number of manually input processes I to the number of processed forms is calculated for each of the columns C1 to C4. This can be obtained by a process similar to the process in step S23 described above. The ratios thus determined are displayed on the operation unit 14. Here, the operator resets the certainty factor for each of the columns C1 to C4 based on the content displayed on the operation unit 14.

【0038】[0038]

【発明の効果】以上詳述したように本発明によれば、人
手によるベリファイを必要とする文字認識システムにお
いて、入力画像の文字認識結果とその確信度を活用する
ことにより、全体の処理能力を向上させることを可能と
する文字認識方法を提供できる。
As described above in detail, according to the present invention, in a character recognition system that requires manual verification, the overall processing capability is improved by utilizing the character recognition result of an input image and its certainty factor. A character recognition method that can be improved can be provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態に係る文字認識システムの
構成を概略的に示すブロック図。
FIG. 1 is a block diagram schematically showing a configuration of a character recognition system according to an embodiment of the present invention.

【図2】被読取物としての帳票の一例を示す図。FIG. 2 is a diagram showing an example of a form as an object to be read.

【図3】フォームデータベースの一例を示す図。FIG. 3 is a diagram showing an example of a form database.

【図4】文字認識処理の流れについて説明するフローチ
ャート。
FIG. 4 is a flowchart illustrating the flow of a character recognition process.

【図5】文字認識処理の流れについて説明するフローチ
ャート。
FIG. 5 is a flowchart illustrating the flow of a character recognition process.

【図6】文字認識処理の流れについて説明するフローチ
ャート。
FIG. 6 is a flowchart illustrating the flow of a character recognition process.

【図7】処理状況テーブルの一例を示す図。FIG. 7 is a diagram showing an example of a processing status table.

【図8】ベリファイ処理時における文字認識結果の選
択、確定画面の一例を示す図。
FIG. 8 is a view showing an example of a screen for selecting and confirming a character recognition result during a verification process.

【符号の説明】[Explanation of symbols]

H…帳票(被読取物)、11…読取部、12…フォーム
識別部、13…制御部、14…操作部、15…フォーム
データベース、16…文字認識部、17…処理状況テー
ブル。
H: form (reading object), 11: reading unit, 12: form identification unit, 13: control unit, 14: operation unit, 15: form database, 16: character recognition unit, 17: processing status table.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 堀内 秀雄 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町事業所内 (72)発明者 名取 直毅 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町事業所内 (72)発明者 中尾 昭彦 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町事業所内 (72)発明者 赤木 琢磨 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町事業所内 (72)発明者 浜村 倫行 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町事業所内 Fターム(参考) 5B029 BB02 CC26 5B064 AA01 BA01 EA08 EA11 EA12 EA27 FA04 FA06 FA13    ────────────────────────────────────────────────── ─── Continuation of front page    (72) Inventor Hideo Horiuchi             70, Yanagicho, Saiwai-ku, Kawasaki City, Kanagawa Prefecture             Toshiba Yanagicho Office (72) Inventor Naoki Natori             70, Yanagicho, Saiwai-ku, Kawasaki City, Kanagawa Prefecture             Toshiba Yanagicho Office (72) Inventor Akihiko Nakao             70, Yanagicho, Saiwai-ku, Kawasaki City, Kanagawa Prefecture             Toshiba Yanagicho Office (72) Inventor Takuma Akagi             70, Yanagicho, Saiwai-ku, Kawasaki City, Kanagawa Prefecture             Toshiba Yanagicho Office (72) Inventor Noriyuki Hamamura             70, Yanagicho, Saiwai-ku, Kawasaki City, Kanagawa Prefecture             Toshiba Yanagicho Office F term (reference) 5B029 BB02 CC26                 5B064 AA01 BA01 EA08 EA11 EA12                       EA27 FA04 FA06 FA13

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 文字が記載されている帳票上の画像を入
力する第1のステップと、 この第1のステップにより入力された入力画像に対し文
字認識を行ない、その文字認識結果としての類似度を得
る第2のステップと、 この第2のステップにより得られた類似度と、あらかじ
め登録された当該文字認識に要求する確信度とを比較す
る第3のステップと、 この第3のステップによる比較の結果に基づき、前記文
字認識結果に対し人手によるベリファイ処理を必要とし
ない出力、前記文字認識結果に対し文字認識候補の選択
肢を提示して人手によるベリファイ処理を促す出力、あ
るいは、前記文字認識結果に対し人手による新規入力お
よび確定を提示して手入力処理を促す出力のいずれかを
行なう第4のステップと、 を具備したことを特徴とする文字認識方法。
1. A first step of inputting an image on a form on which characters are described, and performing character recognition on the input image input in the first step, and the similarity as a result of the character recognition And a third step of comparing the similarity obtained in the second step with a certainty factor required for the character recognition registered in advance, and a comparison in the third step. Output that does not require manual verification processing for the character recognition result, output that presents options of character recognition candidates for the character recognition result to prompt manual verification processing, or the character recognition result A fourth step of presenting a new input and confirmation by hand and performing an output prompting a manual input process. Character recognition method.
【請求項2】 前記帳票は複数の文字記載欄を有し、こ
れら複数の文字記載欄ごとに、前記第2のステップから
第4のステップの処理を行なうことを特徴とする請求項
1記載の文字認識方法。
2. The form according to claim 1, wherein the form has a plurality of character description fields, and the processing from the second step to the fourth step is performed for each of the plurality of character description fields. Character recognition method.
【請求項3】 所定のフォームで文字が記載されている
帳票上の画像を入力する第1のステップと、 この第1のステップにより入力された入力画像により前
記帳票上のフォームを識別する第2のステップと、 この第2のステップにより識別された当該帳票のフォー
ムがあらかじめ登録されているか否かを判定する第3の
ステップと、 この第3のステップによる判定の結果、当該帳票のフォ
ームがあらかじめ登録されていなかった場合、当該フォ
ームおよび当該フォームの文字認識に要求する確信度を
登録する第4のステップと、 前記第3のステップによる判定の結果、当該帳票のフォ
ームがあらかじめ登録されている場合、その登録されて
いるフォームに基づき前記第1のステップにより入力さ
れた入力画像に対し文字認識を行ない、その文字認識結
果としての類似度を得る第5のステップと、 この第5のステップにより得られた類似度と前記あらか
じめ登録された確信度とを比較する第6のステップと、 この第6のステップによる比較の結果に基づき、前記文
字認識結果に対し人手によるベリファイ処理を必要とし
ない出力、前記文字認識結果に対し文字認識候補の選択
肢を提示して人手によるベリファイ処理を促す出力、あ
るいは、前記文字認識結果に対し人手による新規入力お
よび確定を提示して手入力処理を促す出力のいずれかを
行なう第7のステップと、 を具備したことを特徴とする文字認識方法。
3. A first step of inputting an image on a form on which characters are described in a predetermined form, and a second step of identifying the form on the form based on the input image input in the first step. And a third step of determining whether the form of the form identified in the second step is registered in advance. As a result of the determination in the third step, the form of the form is If the form has not been registered, the fourth step of registering the form and the degree of certainty required for character recognition of the form; and if the form of the form has been registered in advance as a result of the determination in the third step, Performing character recognition on the input image input in the first step based on the registered form, A fifth step of obtaining a similarity as a character recognition result; a sixth step of comparing the similarity obtained by the fifth step with the previously registered certainty factor; Based on the result of the comparison, an output that does not require a manual verification process for the character recognition result, an output that presents a character recognition candidate option for the character recognition result to prompt a manual verification process, or the character recognition result 7. A character recognition method comprising: a seventh step of performing one of a manual input process and an output prompting a manual input process by presenting a manual input and a determination to a result.
【請求項4】 前記帳票のフォームは複数の文字記載欄
を有し、これら複数の文字記載欄ごとに、前記第4のス
テップから第7のステップの処理を行なうことを特徴と
する請求項3記載の文字認識方法。
4. The form of the form has a plurality of character description fields, and the processing from the fourth step to the seventh step is performed for each of the plurality of character description fields. The character recognition method described.
【請求項5】 前記第4のステップにより登録されたフ
ォームおよび確信度に基づき処理能力を求めて出力する
第8のステップをさらに具備し、この第8のステップに
より出力された処理能力に満足できない場合、その旨を
指示することにより前記第4のステップによるフォーム
および確信度の登録を再度行なうことを特徴とする請求
項3記載の文字認識方法。
5. The method according to claim 1, further comprising an eighth step of obtaining and outputting a processing capability based on the form and the certainty factor registered in the fourth step, wherein the processing capability output by the eighth step cannot be satisfied. 4. The character recognition method according to claim 3, wherein the registration of the form and the certainty factor in the fourth step is performed again by giving an instruction to that effect.
JP2002147915A 2002-05-22 2002-05-22 Character recognition method Pending JP2003346080A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002147915A JP2003346080A (en) 2002-05-22 2002-05-22 Character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002147915A JP2003346080A (en) 2002-05-22 2002-05-22 Character recognition method

Publications (1)

Publication Number Publication Date
JP2003346080A true JP2003346080A (en) 2003-12-05

Family

ID=29766734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002147915A Pending JP2003346080A (en) 2002-05-22 2002-05-22 Character recognition method

Country Status (1)

Country Link
JP (1) JP2003346080A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6462930B1 (en) * 2018-03-28 2019-01-30 AI inside株式会社 Character recognition apparatus, method and program
JP2019133717A (en) * 2019-05-07 2019-08-08 富士ゼロックス株式会社 Information processor and information processing program
JP2019164687A (en) * 2018-03-20 2019-09-26 富士ゼロックス株式会社 Information processing device
US10540558B2 (en) 2018-03-20 2020-01-21 Fuji Xerox Co., Ltd. Information processing apparatus and non-transitory computer readable medium for determining accuracy of analyzed input data
JP2020042316A (en) * 2018-09-06 2020-03-19 富士ゼロックス株式会社 Information processing apparatus and program
JP2021005159A (en) * 2019-06-25 2021-01-14 富士ゼロックス株式会社 Information processing apparatus and program
US11410408B2 (en) 2019-10-24 2022-08-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program
US11537812B2 (en) 2019-10-24 2022-12-27 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7206605B2 (en) 2018-03-20 2023-01-18 富士フイルムビジネスイノベーション株式会社 Information processing equipment
JP2019164687A (en) * 2018-03-20 2019-09-26 富士ゼロックス株式会社 Information processing device
US10540558B2 (en) 2018-03-20 2020-01-21 Fuji Xerox Co., Ltd. Information processing apparatus and non-transitory computer readable medium for determining accuracy of analyzed input data
JP2019175037A (en) * 2018-03-28 2019-10-10 AI inside株式会社 Character recognition device, method and program
JP6462930B1 (en) * 2018-03-28 2019-01-30 AI inside株式会社 Character recognition apparatus, method and program
JP2020042316A (en) * 2018-09-06 2020-03-19 富士ゼロックス株式会社 Information processing apparatus and program
JP7268311B2 (en) 2018-09-06 2023-05-08 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP2019133717A (en) * 2019-05-07 2019-08-08 富士ゼロックス株式会社 Information processor and information processing program
JP2021005159A (en) * 2019-06-25 2021-01-14 富士ゼロックス株式会社 Information processing apparatus and program
US11321955B2 (en) 2019-06-25 2022-05-03 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
JP7338265B2 (en) 2019-06-25 2023-09-05 富士フイルムビジネスイノベーション株式会社 Information processing device and program
US11537812B2 (en) 2019-10-24 2022-12-27 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program
US11410408B2 (en) 2019-10-24 2022-08-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program

Similar Documents

Publication Publication Date Title
US6370263B1 (en) Method and device for registering and collating palm imprints
WO2019194028A1 (en) Image processing device, image processing method, and storage medium for storing program
JP2007109118A (en) Input instruction processing apparatus and input instruction processing program
CN112990180B (en) Question judging method, device, equipment and storage medium
CN101430758A (en) Document recognizing apparatus and method
JP2003346080A (en) Character recognition method
JP2008020506A (en) Image processor and image processing program
WO2019193923A1 (en) Image processing device, image processing method and recording medium
US20180374247A1 (en) Graph display method, electronic device, and recording medium
JP4807486B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP2000003403A (en) Method for supporting slip input
JP2984287B2 (en) Optical character reader
JP2829002B2 (en) Character recognition device
JP4543190B2 (en) Character judging method, character judging device and computer program
JP3369207B2 (en) Kanji input device
JPH06251187A (en) Method and device for correcting character recognition error
JP2002207960A (en) Method and program for recognized character correction
JPH1196224A (en) Method for inspecting application contents and system for issuing certificate
JPH07210623A (en) Document picture processor
JPH09223197A (en) Character recognition device
JPH08101894A (en) Character recognizing device
JPH0554178A (en) Character recognizing device and slip for correction
JPH0589142A (en) House evaluation point calculation processor
CN117271674A (en) Method and device for identifying field type, electronic equipment and storage medium
JP4850139B2 (en) Document search support processing method, apparatus, and program