JP2002279343A - Recognition result correction device and method, and recording medium - Google Patents

Recognition result correction device and method, and recording medium

Info

Publication number
JP2002279343A
JP2002279343A JP2001077278A JP2001077278A JP2002279343A JP 2002279343 A JP2002279343 A JP 2002279343A JP 2001077278 A JP2001077278 A JP 2001077278A JP 2001077278 A JP2001077278 A JP 2001077278A JP 2002279343 A JP2002279343 A JP 2002279343A
Authority
JP
Japan
Prior art keywords
recognition
representative value
recognition result
item
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001077278A
Other languages
Japanese (ja)
Other versions
JP4299977B2 (en
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001077278A priority Critical patent/JP4299977B2/en
Publication of JP2002279343A publication Critical patent/JP2002279343A/en
Application granted granted Critical
Publication of JP4299977B2 publication Critical patent/JP4299977B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a recognition result correction device in a character recognition device which improves the efficiency of a correcting work, when a large amount of documents are inputted. SOLUTION: This recognition result correction device inputs multiple documents, including one or more recognition items as image data. This device recognizes characters in the respective recognition items, in the respective documents of the inputted image and stores the recognition results of the characters included in the respective recognition items and sureness information in a result storage means 45, by making them correspond to the recognition items. The minimum value and/or an average value of the sureness information of the respective characters, stored in the result storage means 45, are calculated as representative values of the respective recognition items of the respective business forms, a priority order for correcting the recognition results of the respective items in the documents is regarded as the priority order of the sorting key, and the representative value of the recognition item is sorted, so as to determine the order of correcting the documents.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識処理結果
に対する認識結果修正装置、認識結果修正方法および記
録媒体に関し、特に、大量の文書を文字認識したとき、
その認識結果の修正に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recognition result correcting apparatus, a recognition result correcting method, and a recording medium for character recognition processing results.
The correction of the recognition result.

【0002】[0002]

【従来の技術】一般に、文書などの画像イメージを文字
認識すると、認識できない文字があったり、文字を誤認
識したりする。このため、文字認識処理システムでは、
読み取った画像イメージと認識結果とをディスプレイ等
の表示装置に対応表示させて、1枚1枚認識結果を確認
しながら作業を行うことも少量の原稿の場合には可能だ
が、大量の原稿を入力する場合には、認識が終了する度
に1枚1枚認識結果を確認するのでは、非常に作業効率
が悪い。従って、その場合は、バッチ処理的に認識だけ
を先に行い、後でまとめて認識結果を修正する方法がと
られる。このように、後でまとめて認識結果を修正する
場合、作業効率を向上させるために、認識結果とその文
字の画像上の位置(座標値)を画像と関連付けて、認識
結果の文字コード単位に記憶させる方法を採用すること
により、認識結果修正時の誤認文字の発見と修正を容易
にすることが可能になる。
2. Description of the Related Art Generally, when character recognition is performed on an image such as a document, some characters cannot be recognized or characters are erroneously recognized. Therefore, in the character recognition processing system,
It is possible to display the scanned image and the recognition result on a display device such as a display so that the user can work while checking the recognition result one by one. In such a case, if the recognition result is checked one by one every time the recognition is completed, the work efficiency is extremely low. Therefore, in that case, a method is adopted in which only recognition is performed first in batch processing, and the recognition result is collectively corrected later. As described above, when the recognition result is collectively corrected later, in order to improve work efficiency, the recognition result and the position (coordinate value) of the character on the image are associated with the image, and the character code unit of the recognition result is used. By adopting the method of storing, it is possible to easily find and correct erroneous characters when correcting the recognition result.

【0003】[0003]

【発明が解決しようとする課題】このような問題点を解
決するために、特開平6−162253号公報の技術で
は、誤認識された文字や認識できなかった文字の数が予
め設定されている設定値より大きいか否かを判定し、誤
認識された文字や認識できなかった文字の数が予め設定
されている設定値より小さい場合は、誤認識された文字
や認識できなかった文字のイメージデータを表示して修
正させ、設定値より大きい場合は、誤認識された文字や
認識できなかった文字が記入されている帳票のイメージ
データを表示して認識結果を修正させている。しかしな
がら、このような修正方法では、結局、入力した全ての
原稿をチェックする必要が出てくる。例えば、大量の帳
票(N枚とする)の文字認識を処理した場合を想定し、
更に、3枚目と途中のn枚目と最後のN枚目に誤認識が
含まれているとすると、ユーザーは、どこの認識結果に
誤認識が含まれているのかが分からないので、結局、1
枚目から最後のN枚目までを対象として認識結果を確認
することになる。帳票単位で90%以上の認識率が得ら
れていると仮定すると、この場合は、飛び飛びに散らば
っている10%の誤認識を含む認識結果のために、残り
の90%の誤認識を含まない認識結果を確認しなければ
ならないことになる。従って、どこに誤認識が含まれて
いるのか分からないことが、ユーザーを不安にさせ、作
業効率を低下させることになる。本発明は、このような
問題を解決するためのものであり、文字認識処理におい
て、大量の帳票のような文書を一度に文字認識すると
き、その認識結果を修正する作業効率を向上させる認識
結果修正装置、認識結果修正方法および記録媒体を提供
することを目的とする。
In order to solve such a problem, in the technique disclosed in Japanese Patent Laid-Open No. 6-162253, the number of erroneously recognized or unrecognized characters is set in advance. It is determined whether the value is larger than the set value, and if the number of misrecognized or unrecognized characters is smaller than a preset value, the image of the misrecognized character or the unrecognizable character is displayed. The data is displayed and corrected. If the data is larger than the set value, the image data of the form in which the erroneously recognized or unrecognized character is entered is displayed to correct the recognition result. However, in such a correction method, it is necessary to check all input originals. For example, suppose a case where character recognition of a large number of forms (assuming N sheets) is processed,
Further, if erroneous recognition is included in the third sheet, the n-th sheet in the middle, and the last N-th sheet, the user does not know which recognition result includes the erroneous recognition. , 1
The recognition result is confirmed for the first to Nth sheets. Assuming that a recognition rate of 90% or more is obtained for each report, in this case, the remaining 90% of false recognitions are not included due to the recognition result including 10% of false recognitions scattered. The recognition result must be confirmed. Therefore, not knowing where the erroneous recognition is included makes the user anxious and lowers the work efficiency. The present invention is intended to solve such a problem, and in character recognition processing, when performing character recognition on a large amount of documents at once, a recognition result that improves the work efficiency of correcting the recognition result. It is an object to provide a correction device, a recognition result correction method, and a recording medium.

【0004】[0004]

【課題を解決するための手段】上記の問題を解決するた
めに、本発明の請求項1は、1つ以上の認識項目を含む
帳票を画像データとして複数枚入力した画像の前記各帳
票内の各認識項目中の文字の認識結果と確からしさの情
報を求める文字認識装置において、前記認識結果の確か
らしさの情報から前記各帳票内の各認識項目の代表値を
求める代表値計算手段と、前記帳票内の各認識項目の認
識結果を修正する優先順位を指示する優先順位指示手段
と、前記優先順位指示手段で指示された優先順位にした
がって、前記代表値計算手段で求められた各認識項目の
代表値をもとに、認識結果を修正する帳票の順番を決定
する修正順序決定手段とを備えたことを特徴とする。ま
た、本発明の請求項2は、請求項1記載の認識結果修正
装置において、前記修正順序決定手段は、前記優先順位
指示手段で指示された認識項目の優先順位をソートキー
の優先順位とし、その認識項目の代表値をソートするこ
とによって修正する帳票の順番を決定するようにしたこ
と特徴とする。
In order to solve the above-mentioned problems, a first aspect of the present invention is to provide an image in which a plurality of forms including one or more recognition items are input as image data in each of the forms. In a character recognition device that obtains information on the recognition result and certainty of the character in each recognition item, a representative value calculation unit that obtains a representative value of each recognition item in each form from information on the certainty of the recognition result, Priority order instructing means for instructing a priority order for correcting the recognition result of each recognition item in the form; and, for each recognition item obtained by the representative value calculating means, according to the priority order instructed by the priority order instructing means. Correction order determining means for determining the order of a form for correcting the recognition result based on the representative value. According to a second aspect of the present invention, in the recognition result correcting apparatus according to the first aspect, the correction order determining means sets the priority of the recognition item designated by the priority designating means as the priority of the sort key, The order of the form to be corrected is determined by sorting the representative values of the recognition items.

【0005】また、本発明の請求項3は、請求項2記載
の認識結果修正装置において、前記修正順序決定手段
は、同じ値の代表値が複数存在する場合は、その同じ代
表値を持つ帳票について、次の優先順位の認識項目の代
表値でソートすることによって、修正する帳票の順番を
決定するようにしたことを特徴とする。また、本発明の
請求項4は、請求項2記載の認識結果修正装置におい
て、前記修正順序決定手段は、同じ値の代表値が複数存
在する場合は、その同じ代表値を持つ帳票について、そ
の認識項目の他の代表値でソートすることによって、修
正する帳票の順番を決定するようにしたことを特徴とす
る。また、本発明の請求項5は、請求項1乃至請求項4
のいずれか1つに記載の認識結果修正装置において、前
記代表値計算手段は、前記認識項目内の各文字の確から
しさ情報の最小値および/または平均値を代表値として
計算することを特徴とする。また、本発明の請求項6
は、請求項1乃至請求項5のいずれか1つに記載の認識
結果修正装置おいて、修正対象となる認識項目の代表値
の推移と現在修正している帳票との関係を表示する状態
表示手段を備えることを特徴とする。また、本発明の請
求項7は、1つ以上の認識項目を含む帳票を画像データ
として複数枚入力した画像の前記各帳票内の各認識項目
中の文字の認識結果と確からしさの情報を求める文字認
識方法において、前記認識結果の確からしさの情報から
前記各帳票内の各認識項目の代表値を求め、前記帳票内
の各認識項目の認識結果を修正する優先順位を指示し、
この指示された優先順位をソートキーの優先順位とし、
その認識項目の代表値をソートすることによって修正す
る帳票の順番を決定することを特徴とする。また、本発
明の請求項8は、請求項7記載の認識結果修正方法にお
いて、代表値でソートする際、同じ値の代表値が複数存
在する場合は、その同じ代表値を持つ帳票について、次
の優先順位の認識項目の代表値でソートすることによっ
て、修正する帳票の順番を決定するようにしたことを特
徴とする。
According to a third aspect of the present invention, in the recognition result correcting apparatus according to the second aspect, when a plurality of representative values having the same value exist, the correction order determining means may determine that the form has the same representative value. Is characterized in that the order of the form to be corrected is determined by sorting by the representative value of the next priority recognition item. According to a fourth aspect of the present invention, in the recognition result correcting apparatus according to the second aspect, when there are a plurality of representative values having the same value, the correction order determining means determines whether a form having the same representative value has the same value. The order of the form to be corrected is determined by sorting by another representative value of the recognition item. Claim 5 of the present invention relates to claims 1 to 4
Wherein the representative value calculating means calculates a minimum value and / or an average value of certainty information of each character in the recognition item as a representative value. I do. Further, claim 6 of the present invention
A status display for displaying a relationship between a transition of a representative value of a recognition item to be corrected and a form currently being corrected in the recognition result correcting apparatus according to any one of claims 1 to 5. It is characterized by comprising means. According to a seventh aspect of the present invention, a plurality of forms including one or more recognition items are input as image data, and information of recognition results and certainty of characters in each of the recognition items in each of the forms in the form is obtained. In the character recognition method, a representative value of each recognition item in each form is obtained from information on the likelihood of the recognition result, and a priority order for correcting the recognition result of each recognition item in the form is indicated,
The designated priority is set as the priority of the sort key,
The order of the form to be corrected is determined by sorting the representative values of the recognition items. Further, according to claim 8 of the present invention, in the recognition result correcting method according to claim 7, when a plurality of representative values of the same value are present when sorting by the representative value, the form having the same representative value is determined as follows. The order of the forms to be corrected is determined by sorting by the representative values of the recognition items of the priority order.

【0006】また、本発明の請求項9は、請求項7記載
の認識結果修正装置において、代表値でソートする際、
同じ値の代表値が複数存在する場合は、その同じ代表値
を持つ帳票について、その認識項目の他の代表値でソー
トすることによって、修正する帳票の順番を決定するよ
うにしたことを特徴とする。また、本発明の請求項10
は、請求項7乃至請求項9のいずれか1つに記載の認識
結果修正方法において、修正対象となる認識項目の代表
値の推移と現在修正している帳票との関係を表示して、
現在の修正状態を表示することを特徴とする。また、本
発明の請求項11は、請求項1乃至請求項6のいずれか
1つに記載の認識結果修正装置の機能を実現させるため
のプログラムを記録した。
According to a ninth aspect of the present invention, in the recognition result correcting apparatus according to the seventh aspect, when sorting by representative values,
When there are a plurality of representative values having the same value, the order of the forms to be corrected is determined by sorting the forms having the same representative value by other representative values of the recognition item. I do. Claim 10 of the present invention
Displays the relationship between the transition of the representative value of the recognition item to be corrected and the form currently being corrected, in the recognition result correcting method according to any one of claims 7 to 9,
The present correction state is displayed. An eleventh aspect of the present invention records a program for realizing the function of the recognition result correcting apparatus according to any one of the first to sixth aspects.

【0007】[0007]

【発明の実施の形態】以下に、図面を用いて本発明の実
施例の構成および動作を詳細に述べる。 <実施例> (1)構成 図1は、本発明の一実施例である文字認識装置の構成を
あらわすブロック図である。実施例の文字認識装置は、
制御手段10、項目設定手段20、画像入力手段30、
文字認識手段40、代表値計算手段50、優先順位指示
手段60、修正順位決定手段70、状況表示手段80項
目設定記憶手段25、結果記憶手段45から構成されて
いる。制御手段10は、文書(帳票)に設定された認識
項目の領域の指示、その領域に対して文書画像の入力か
ら文字認識結果の修正までの全体の機能手段を制御す
る。項目設定手段20は、以後に読み込まれる大量の文
書(帳票)上の認識項目がどこに設定されているかを、
帳票の雛型をスキャナー等の画像入力装置で読み込み、
これをディスプレイ等の表示装置へ表示させ、ユーザー
にマウス等でその領域を指定させる。この指定された領
域は、認識項目ごとに項目設定記憶手段25へ登録され
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The construction and operation of an embodiment of the present invention will be described below in detail with reference to the drawings. Embodiment (1) Configuration FIG. 1 is a block diagram showing a configuration of a character recognition device according to an embodiment of the present invention. The character recognition device of the embodiment is
Control means 10, item setting means 20, image input means 30,
It comprises a character recognition means 40, a representative value calculation means 50, a priority order instructing means 60, a correction order determining means 70, a status display means 80, an item setting storage means 25, and a result storage means 45. The control means 10 designates an area of a recognition item set in a document (form) and controls the entire functional means from input of a document image to correction of a character recognition result for the area. The item setting means 20 determines where a recognition item in a large number of documents (forms) to be read thereafter is set.
Read the form template with an image input device such as a scanner,
This is displayed on a display device such as a display, and the user is caused to specify the area with a mouse or the like. The designated area is registered in the item setting storage unit 25 for each recognition item.

【0008】項目設定記憶手段25は、図2に示すよう
に、ユーザーが指定した帳票の雛型に設定された認識項
目ごとに、認識項目名、その領域の位置座標、高さ、
幅、優先順位を保持する。その他の項目としては、その
項目に関する領域の属性(入力される文字タイプ、フォ
ント、色、セキュリティ)が考えられる。画像入力手段
30は、大量の文書(帳票)をスキャナー、複写機等の
画像入力装置から画像データとして直接読み込む。また
は、文書を画像入力装置から読み込んでファイルとして
記憶装置へ書き込んでおき、このファイルから読み込む
ようにしてもよい。文字認識手段40は、画像入力手段
30で得た1枚ごとの画像データより、項目設定記憶手
段25に設定された認識領域ごとに個々の文字画像が切
り出され、大きさが正規化され、この正規化された文字
画像の特徴量を抽出し、この特徴量と認識辞書との比較
を行ない、認識の確からしさとしての確信度が大きい順
に一定個数の候補文字を求め、候補文字とその確信度と
を認識結果として、結果記憶手段45に登録する。尚、
各文字の確からしさを求める方法は、特開平4−211
883号公報の技術によって求められる。
As shown in FIG. 2, the item setting storage means 25 stores, for each recognition item set in the form of the form specified by the user, the recognition item name, the position coordinates of the area, the height,
Preserve breadth and priority. As other items, attributes of a region related to the item (input character type, font, color, security) can be considered. The image input unit 30 directly reads a large amount of documents (forms) as image data from an image input device such as a scanner or a copying machine. Alternatively, the document may be read from the image input device, written in the storage device as a file, and read from this file. The character recognizing unit 40 cuts out individual character images for each recognition area set in the item setting storage unit 25 from the image data for each sheet obtained by the image input unit 30, and normalizes the size. The feature amount of the normalized character image is extracted, the feature amount is compared with the recognition dictionary, and a certain number of candidate characters are obtained in order of the degree of certainty as the certainty of the recognition. Are registered in the result storage means 45 as a recognition result. still,
A method for determining the certainty of each character is disclosed in
883.

【0009】結果記憶手段45は、図3に示すように、
帳票ヘッダー、代表値表、候補文字表からなっている。
帳票ヘッダーは、1つの帳票に対して1つのエントリを
持っており、その1つのエントリは次の項目を有してい
る。 (A)番号 帳票が入力され、帳票の文字認識が開始されるときにカ
ウントアップされ、ここに設定される。 (B)順序 認識された各帳票の候補文字列を修正するとき、どの帳
票から修正するのかを示す順序を示し、修正順位決定手
段70によって設定される。 (C)画像データへのポインタ 画像入力手段30で入力された画像イメージを格納する
ファイルへのポインタであって、文字認識手段40およ
び文字認識結果を修正するときの元情報として表示され
る。 (D)代表値表へのポインタ 帳票中の認識項目に関する代表値等の情報を保持する代
表値表へのポインタであり、代表値に関しては代表値計
算手段50によって設定される。
[0009] As shown in FIG.
It consists of a form header, a representative value table, and a candidate character table.
The form header has one entry for one form, and the one entry has the following items. (A) Number When a form is input and character recognition of the form is started, it is counted up and set here. (B) Order When the candidate character string of each recognized form is corrected, the order indicates which form to correct from, and is set by the correction order determination means 70. (C) Pointer to image data This is a pointer to a file that stores the image input by the image input unit 30, and is displayed as original information when correcting the character recognition unit 40 and the character recognition result. (D) Pointer to representative value table This is a pointer to a representative value table that holds information such as representative values related to recognition items in a form, and the representative values are set by the representative value calculation unit 50.

【0010】代表値表は、1つの帳票中の認識項目ごと
に、次の項目を有するエントリを持っている。 (A)代表値1 この認識項目における文字列中の各文字の確信度のうち
最小の値である。 (B)代表値2 この認識項目における文字列中の各文字の確信度の平均
値である。 (C)文字数 この認識項目における文字列の文字数である。文字認識
手段40で設定される。 (D)候補文字へのポインタ 認識項目の画像領域の認識結果を表す候補文字へのポイ
ンタであって、文字認識手段40で、認識された候補文
字を登録するときに作成される。候補文字表は、この領
域中の各文字画像に対して、認識結果の候補文字(文字
コード)とその確信度とを確信度の大きい方から10位
までを保持する。この候補文字表は、文字認識手段40
で設定される。
The representative value table has an entry having the following items for each recognition item in one form. (A) Representative value 1 This is the minimum value of the certainty factor of each character in the character string in this recognition item. (B) Representative value 2 This is the average value of the certainty factor of each character in the character string in this recognition item. (C) Number of characters This is the number of characters in the character string in this recognition item. It is set by the character recognition means 40. (D) Pointer to candidate character This is a pointer to a candidate character representing the recognition result of the image area of the recognition item, and is created when the character recognition unit 40 registers the recognized candidate character. The candidate character table holds, for each character image in this region, the candidate character (character code) of the recognition result and its certainty, from the one with the highest certainty to the tenth. This candidate character table is stored in the character recognition unit 40.
Is set by

【0011】代表値計算手段50は、各帳票ごとに、各
認識項目の代表値を次のように計算して、結果記憶手段
45へ登録する(図3参照)。 (A)認識項目内の各文字の1位の候補文字の確信度
(確からしさ)の最小値とする。1項目に存在する全文
字の中で、最小の確信度を代表値とする。この代表値は
確信度が低い程、認識結果が信頼できず、確信度が高い
程、認識結果を信頼できることを示している。例えば、
図2を参照すると、帳票中の認識項目AからFに対し
て、それらの含まれている各文字に対する認識候補文字
の確信度の最小値を代表値とする。この例では、認識項
目Aに対して6文字が認識され、それらの各文字の確信
度を見ると、4文字目の確信度20が最小値である。従
って、認識項目Aの代表値を20とする。 (B)認識項目内の各文字の1位の候補文字の確信度
(確からしさ)の平均値とする。1項目に存在する全文
字の確信度の平均値とする。例えば、図3を参照する
と、帳票中の認識項目AからFに対して、それらの含ま
れている各文字に対する認識候補文字の確信度の平均値
を代表値とする。この例では、認識項目Aに対して6文
字が認識され、それらの各文字の確信度の平均をとる
と、71である。従って、認識項目Aの代表値を71と
する。優先順位指示手段60は、帳票中の認識項目の
内、どの項目が重要なものであるかの優先順位を指示す
る。これは項目設定記憶手段25に登録されている認識
項目の項目名、領域位置等を表示させて、ユーザーが指
示し、その順番を項目設定記憶手段20へ登録する。例
えば、通常、帳票内には幾つかの認識項目(例えば、帳
票ID、金額欄、氏名、ふりがな、備考欄等)があり、
それぞれ求められる認識精度が異なっている。帳票ID
等のように検索時のキーワードとなる項目や金額欄等の
ような重要な項目は、高い認識精度が要求されるが、備
考欄等のような項目は、それほど高い認識精度は要求さ
れない。従って、どのような順番で各認識項目を修正す
るべきか、その優先順位をユーザーに指定させる。
The representative value calculating means 50 calculates the representative value of each recognition item for each form as follows, and registers it in the result storage means 45 (see FIG. 3). (A) The minimum value of the certainty factor (probability) of the first candidate character of each character in the recognition item. The smallest certainty factor among all the characters existing in one item is set as a representative value. This representative value indicates that the lower the confidence, the less reliable the recognition result, and the higher the confidence, the more reliable the recognition result. For example,
Referring to FIG. 2, for the recognition items A to F in the form, the minimum value of the degree of certainty of the recognition candidate character for each included character is set as the representative value. In this example, six characters are recognized for the recognition item A, and looking at the certainty of each of those characters, the certainty 20 of the fourth character is the minimum value. Therefore, the representative value of the recognition item A is set to 20. (B) The average value of the credibility (probability) of the first candidate character of each character in the recognition item. An average value of the certainty factors of all the characters in one item. For example, referring to FIG. 3, for the recognition items A to F in the form, the average value of the degrees of certainty of the recognition candidate characters for each of the included characters is used as the representative value. In this example, six characters are recognized for the recognition item A, and the average of the certainty factors of those characters is 71. Therefore, the representative value of the recognition item A is set to 71. The priority order instructing means 60 indicates a priority order as to which of the recognition items in the form is important. In this case, the item names, area positions, etc. of the recognition items registered in the item setting storage unit 25 are displayed, the user gives an instruction, and the order is registered in the item setting storage unit 20. For example, there are usually several recognition items (for example, a form ID, an amount column, a name, a phonetic note, a remarks column, etc.) in a form,
The required recognition accuracy is different. Report ID
For example, important items such as an item serving as a keyword at the time of search and an amount column, etc., require high recognition accuracy, but items such as a remarks column do not require high recognition accuracy. Therefore, the user is required to specify the order in which each recognition item should be corrected.

【0012】この優先順位は、修正順位決定手段70で
代表値をソートするとき、どの帳票の認識結果から修正
したらよいかを決めるときのソートキーの優先順位と一
致する。例えば、認識項目にA,B,C,D,Eの5つ
があり、それらの優先順位が4,2,3,1,5であっ
たとき、1次キー:D、2次キー:B、3次キー:C、
4次キーA、5次キー:Eとして5つのキーで各帳票の
代表値をソートする。また、この優先順位指示手段60
は、項目設定手段20と一緒に動作させるように構成し
てもよい。修正順位決定手段70は、優先順位指示手段
60で指定された優先順位をソートの優先キーとみなし
て、認識項目の代表値(例えば、最小値を示す代表値1
であっても、平均値を示す代表値2のいずれであっても
よい)の小さい順にソートする。このソート結果は、結
果記憶手段45の帳票ヘッダーの項目「順序」に格納さ
れる。
When the representative values are sorted by the correction order determining means 70, the priorities coincide with the priorities of the sort keys for determining which form to recognize based on the recognition result. For example, when there are five recognition items A, B, C, D, and E, and their priorities are 4, 2, 3, 1, and 5, a primary key: D, a secondary key: B, Tertiary key: C,
The representative value of each form is sorted by five keys as a quaternary key A and a tertiary key: E. Also, the priority order indicating means 60
May be configured to operate together with the item setting means 20. The correction order determining means 70 regards the priority specified by the priority indicating means 60 as a sorting priority key, and determines a representative value of the recognition item (for example, a representative value 1 indicating the minimum value).
, Or any of the representative values 2 indicating the average value). This sort result is stored in the item “order” of the form header of the result storage unit 45.

【0013】このソートにおいて、代表値(代表値1ま
たは代表値2)に同じ値が存在するときに以下のような
処理をする。 (A)次の優先順位の認識項目の代表値で順番を決定す
る。このときの代表値も同種のものでも、異種のものの
いずれであってもよい。 (B)同じ値を示した認識項目に対する他の代表値で大
小で順番を決定する。はじめに代表値1でソートしてい
たときには、代表値2を使ってソートするという具合で
ある。 (C)代表値1(最小値)も代表値2(平均値)も同じ
であれば、次のような別の基準によってソートする。 ・入力した文書(帳票)の順番 画像入力装置から読み取った文書の順番で、この順番は
文書の順番が時系列(日付等)で並んでいる可能性が高
いと思われるからである。 ・認識項目の文字数 この場合は、認識対象文書の内容に依存する可能性が大
きいと思われるので、文字数が多い方を優先するか、ま
たは、少ない方を優先するのかをユーザーが設定できる
ようにする。
In this sorting, when the same value exists in the representative value (representative value 1 or representative value 2), the following processing is performed. (A) The order is determined based on the representative value of the next priority recognition item. The representative value at this time may be the same or different. (B) The order is determined based on the other representative values for the recognition items having the same value, in descending order. First, when sorting is performed using the representative value 1, sorting is performed using the representative value 2. (C) If the representative value 1 (minimum value) and the representative value 2 (average value) are the same, the data is sorted by another criterion as follows. -Order of input documents (forms) This is the order of documents read from the image input device. This is because it is highly likely that the order of the documents is arranged in chronological order (such as date).・ Number of characters in recognition item In this case, since it is highly likely that it depends on the contents of the document to be recognized, the user can set whether to give priority to the one with a large number of characters or the one with a small number of characters. I do.

【0014】状況表示手段80は、文字認識された結果
の候補文字を確定する修正作業時に、現在処理している
帳票に関する作業状況をディスプレイ等の表示装置へ表
示させる。例えば、図6に示すように、ある認識項目に
ついて次のような項目を数値やグラフを用いて表示し、
ユーザーに現在どのあたりを修正しているかの情報を提
供する。 (A)この認識項目の代表値が帳票全体では、どのよう
に推移しているかを示す推移状況をグラフで表示する。 (B)現在修正している帳票の最初からの枚数を数値や
グラフ上の位置で表示する。 (C)その帳票のこの認識項目に関する代表値の値を数
値とグラフで表示する。 (D)同じ値の代表値を持つ帳票の枚数を数値で表示す
る。 このような表示をすることにより、現在の修正処理が、
全体の中のどの程度処理したのか、どのあたりを処理し
ているのか、その後どの程度修正すればよいのかを把握
することができる。このような表示は、常に表示させる
ようにしても良いし、メニュー等で指定したときのみ表
示するようにしてもよい。修正順位決定手段70でソー
トした結果、図7に示すように、各認識項目の代表値
(確信度)が低い、即ち、誤認識文字を含む確率の高い
ものから順番に並ぶために、認識結果の修正作業が最初
の方に集中し、代表値が高くなるにつれて、修正作業の
負荷が下降していき、やがて、まったく修正する必要が
なくなってくる。ユーザーは、この図7のようなカーブ
を頭に描きながら、且つ、現在、修正している認識結果
の代表値を知ることで、全体のカーブのどのあたりを修
正しているのか把握しながら作業ができる。その後、ま
ったく修正する必要がない認識結果がある程度続いたと
き(図7の影で表示されたα枚分)、残りの認識結果は
誤変換がないとユーザーは判断し、修正作業を途中で終
了することができる。
The status display means 80 causes a display device such as a display to display the status of work on a form currently being processed at the time of correction work for determining candidate characters as a result of character recognition. For example, as shown in FIG. 6, for a certain recognition item, the following items are displayed using numerical values and graphs,
Give users information about where they are currently modifying. (A) A graph showing the transition status indicating how the representative value of this recognition item has changed in the entire form. (B) The number of sheets from the beginning of the form currently being corrected is displayed as a numerical value or a position on a graph. (C) The value of the representative value for this recognition item of the form is displayed as a numerical value and a graph. (D) The number of forms having the same representative value is displayed numerically. By making such a display, the current correction process
It is possible to grasp how much of the whole is processed, what is being processed, and how much should be corrected thereafter. Such a display may be always displayed, or may be displayed only when specified by a menu or the like. As a result of sorting by the correction order determining means 70, as shown in FIG. 7, the representative values (confidence) of the recognition items are low, that is, the recognition items are arranged in descending order of the probability of containing a misrecognized character. The correction work concentrates on the beginning, and as the representative value increases, the load of the correction work decreases, and eventually there is no need to make any correction. The user works while drawing the curve as shown in FIG. 7 in the head and knowing which part of the whole curve is being corrected by knowing the representative value of the currently-recognized recognition result. Can be. Thereafter, when the recognition result that does not need to be corrected at all continues to some extent (for the α sheets displayed in the shadow of FIG. 7), the user determines that the remaining recognition result has no erroneous conversion, and ends the correction work halfway. can do.

【0015】このような構成において、実施例の文字認
識装置は次のように動作する。先ず、処理制御手段10
は、文字認識する帳票の認識項目がどこにあるかをユー
ザーに指定させるために項目設定手段20を呼び出す。
この項目設定手段20は、帳票の雛型をスキャナー等の
画像入力装置で読み込み、これをディスプレイ等の表示
装置へ表示させ、ユーザーにマウス等によってその領域
を指定させ、この指定された領域は、認識項目ごとに項
目設定記憶手段25へ登録される。次に、制御手段10
は、帳票1枚ごとに画像入力手段30、文字認識手段と
続けてを呼び出し、帳票がなくなるまで繰り返す。画像
入力手段30は、文書(帳票)をスキャナー、複写機等
の画像入力装置から画像データとして直接読み込むか、
または、文書を画像入力装置から読み込んでファイルと
して記憶装置へ書き込んでおき、このファイルから読み
込むようにしてもよい。1枚の帳票を読み込むと、その
帳票に対して文字認識手段40が呼び出され、この帳票
上にある認識項目の画像領域に対して文字認識処理が行
われる。1枚ごとの画像データから、項目設定記憶手段
25に設定された認識領域ごとに個々の文字画像が切り
出され、大きさが正規化され、この正規化された文字画
像の特徴量を抽出し、この特徴量と認識辞書との比較を
行ない、認識の確からしさとしての確信度が大きい順に
一定個数の候補文字を求め、候補文字とその確信度とを
認識結果として、結果記憶手段45に登録する。結果記
憶手段45へ登録するとき、帳票の入力順番号(認識処
理されるときに帳票番号はカウントアップされる)、帳
票の画像データのファイルへのポインタ、その帳票にあ
る認識項目に対応している代表値表へのポインタからな
る帳票ヘッダーを作成する。また、代表値表へは、各認
識項目の中にあった文字列の文字数、候補文字表へのポ
インタを作成する。候補文字表へは、この領域にあった
画像文字列にある各文字画像に対して、認識結果の候補
文字(文字コード)とその確信度とを確信度の大きい方
から10位までを登録する。
In such a configuration, the character recognition device of the embodiment operates as follows. First, the processing control means 10
Calls the item setting means 20 to allow the user to specify where the recognition item of the form for character recognition is.
The item setting means 20 reads the form template with an image input device such as a scanner, displays the form on a display device such as a display, and allows the user to specify the area with a mouse or the like. Each recognition item is registered in the item setting storage unit 25. Next, the control means 10
Is called successively with the image input means 30 and the character recognition means for each form, and is repeated until there are no more forms. The image input unit 30 directly reads a document (form) as image data from an image input device such as a scanner or a copying machine,
Alternatively, the document may be read from the image input device, written in the storage device as a file, and read from this file. When one form is read, the character recognizing means 40 is called for the form, and character recognition processing is performed on the image area of the recognition item on the form. From each image data, an individual character image is cut out for each recognition area set in the item setting storage unit 25, the size is normalized, and the feature amount of the normalized character image is extracted. The feature amount is compared with the recognition dictionary, a certain number of candidate characters are obtained in the order of the certainty as the certainty of the recognition, and the candidate characters and the certainty are registered in the result storage unit 45 as the recognition result. . When registering in the result storage means 45, the input order number of the form (the form number is counted up when the recognition processing is performed), a pointer to the file of the image data of the form, and the recognition item in the form Creates a report header consisting of pointers to the representative value tables. In the representative value table, the number of characters of a character string in each recognition item and a pointer to a candidate character table are created. In the candidate character table, for each character image in the image character string in this area, the candidate character (character code) of the recognition result and its certainty are registered from the one with the highest certainty to the tenth place. .

【0016】制御手段10は、文字認識の対象となった
文書(帳票)の入力が終わると、認識結果を修正するた
めに、先ず、代表値計算手段50を呼び出す。代表値計
算手段50は、結果記憶手段45に登録されている各帳
票ごとに、各認識項目の代表値を次のようにして計算し
て、結果記憶手段45へ追加登録する。 (A)認識項目内の各文字の1位の候補文字の確信度の
最小値とする。 (B)認識項目内の各文字の1位の候補文字の確信度の
平均値とする。 次に、制御手段10は優先順位指示手段60を呼び出
す。優先順位指示手段60は、項目設定記憶手段25に
登録されている認識項目の項目名、領域位置等を表示さ
せて、その内のどの項目が重要なものであって、どの項
目を優先的に修正しなければならないかの優先順位をユ
ーザーに指示させ、その順番を項目設定記憶手段20へ
追加登録する。また、この優先順位指示手段60は、項
目設定手段20と一緒に動作させるように構成してもよ
い。次いで、制御手段10は、認識結果の修正をどのよ
うな順番で行えば、効率よく修正できるかの順番を決め
るために修正順位決定手段70を呼び出す。修正順位決
定手段70は、項目設定記憶手段25に記憶された認識
項目の優先順位をソートの優先キーとみなして、認識項
目の代表値の小さい順にソートする。
When the input of the document (form) subjected to the character recognition is completed, the control means 10 first calls the representative value calculation means 50 in order to correct the recognition result. The representative value calculation means 50 calculates the representative value of each recognition item for each form registered in the result storage means 45 as follows, and additionally registers it in the result storage means 45. (A) The minimum value of the certainty factor of the first candidate character of each character in the recognition item. (B) The average value of the degrees of certainty of the first candidate character of each character in the recognition item. Next, the control means 10 calls the priority order indicating means 60. The priority order indicating means 60 displays the item names, area positions, and the like of the recognition items registered in the item setting storage means 25, and which of the items is important and which of the items is given priority. The user is instructed on the priority order of the correction, and the order is additionally registered in the item setting storage unit 20. Further, the priority order indicating means 60 may be configured to operate together with the item setting means 20. Next, the control unit 10 calls the correction order determination unit 70 in order to determine the order in which the correction of the recognition result should be performed efficiently. The correction order determination unit 70 regards the priority order of the recognition items stored in the item setting storage unit 25 as a sorting priority key, and sorts the recognition items in ascending order of the representative value of the recognition items.

【0017】このソート結果は、結果記憶手段45の帳
票ヘッダーの項目「順序」に格納される。このソートに
おいて、代表値に同じ値が存在するときには、以下のい
ずれかの処理をする。 (A)次の優先順位の認識項目の代表値で順番を決定す
る。 (B)同じ値を示した認識項目に対する他の代表値で大
小で順番を決定する。 (C)上記いずれでも決まらないときには、入力した文
書(帳票)の順番や認識項目の文字数のような別の基準
を使って、順番を決定する。 このような準備を行った後、ユーザーが文字認識された
結果の候補文字を確定する修正作業時に作業状況を示す
ために制御手段10は、状況表示手段80を呼び出す。
この呼び出しによる状況表示は、常に表示させるように
しても良いし、メニュー等で指定したときのみ表示する
ようにしてもよい。このときの作業状況は、ある認識項
目について次のような内容を数値やグラフを用いてディ
スプレイ等の表示装置へ表示し、ユーザーに現在どのあ
たりを修正しているかの情報を提供する。 (A)その項目の代表値が帳票全体でどのように推移状
況(グラフ) (B)現在修正している帳票の最初からの枚数(数値と
グラフ上の位置) (C)その帳票のこの項目に関する代表値の値(数値と
グラフ) (D)同じ値の代表値を持つ帳票の枚数(数値) 上記のような構成にすることにより、帳票のような定型
の書式に作成された大量の文書(帳票)を読み込んで、
文字認識した後の候補文字の修正を行う作業において、
ユーザーは現在の修正処理が、どの程度の処理量がある
のか、どの程度処理したのか、どの程度残っているのか
を把握することができるので、まったく修正する必要が
ない認識結果がある程度続いたとき、残りを修正するべ
きかどうかを判断して、作業を途中で終了することがで
きる。
This sort result is stored in the item “order” of the form header in the result storage means 45. In this sorting, when the same value exists as the representative value, one of the following processes is performed. (A) The order is determined based on the representative value of the next priority recognition item. (B) The order is determined based on the other representative values for the recognition items having the same value, in descending order. (C) If none of the above is used, the order is determined using another standard such as the order of the input document (form) or the number of characters of the recognition item. After such preparation, the control unit 10 calls the status display unit 80 to indicate the work status at the time of the correction work in which the user determines the candidate character as a result of the character recognition.
The status display by this call may be always displayed, or may be displayed only when specified by a menu or the like. The work status at this time displays the following contents for a certain recognition item on a display device such as a display using numerical values and graphs, and provides the user with information on which part is currently being corrected. (A) How the representative value of the item changes over the entire form (graph) (B) Number of sheets from the beginning of the form currently being corrected (numerical value and position on the graph) (C) This item of the form (Numerical value and graph) (D) Number of forms having the same representative value (numerical value) With the above configuration, a large number of documents created in a standard format like a form (Form)
In the work of correcting candidate characters after character recognition,
Since the user can understand how much processing amount is being processed, how much processing has been performed, and how much remains, the recognition result that does not need to be corrected at all has continued to some extent It is possible to determine whether the rest should be corrected and to end the operation halfway.

【0018】この終了の判断はユーザーが行うため、自
由にこの判断基準を変更することができことから、柔軟
なシステム運用ができることになる。例えば、重要な項
目には厳しくチェックし、重要ではない項目は、早めに
修正作業を打ち切ることも可能となってくる。従って、
文書(帳票)が少量の時の効果よりも、大量の時の方が
短い修正作業時間で、品質の高い認識結果を得るという
修正作業の向上とともに、労力削減効果が大きくなる。
Since the user determines this termination, the criterion can be freely changed, so that the system can be operated flexibly. For example, it is possible to check strictly for important items, and to discontinue correction work for non-important items as soon as possible. Therefore,
When the number of documents (forms) is small, the effect of reducing the labor is increased, as well as the effect of improving the correction operation to obtain a high-quality recognition result in a shorter correction operation time in the case of a large amount of documents.

【0019】(2)処理の流れ 図8は、本実施例の文字認識装置の処理の流れを説明す
るためのフローチャートである。帳票の雛型をスキャナ
ー等の画像入力装置で読み込み、これをディスプレイ等
の表示装置へ表示させ、ユーザーにマウス等によって、
文字認識する帳票の認識項目の領域がどこにあるかを指
定させる(ステップS100)。この指定された領域
は、認識項目ごとに項目設定記憶手段25へ登録され
る。1枚の文書(帳票)をスキャナー、複写機等の画像
入力装置から画像データとして直接読み込む(ステップ
S110)。または、文書を画像入力装置から読み込ん
でファイルとして記憶装置へ書き込んでおき、このファ
イルから1画像データとして読み込むようにしてもよ
い。1枚の画像データから、項目設定記憶手段25に設
定された認識領域ごとに個々の文字画像が切り出され、
大きさが正規化され、この正規化された文字画像の特徴
量を抽出し、この特徴量と認識辞書との比較を行ない、
認識の確からしさとしての確信度が大きい順に一定個数
の候補文字を求め、候補文字とその確信度とを認識結果
として、結果記憶手段45に登録する(ステップS12
0)。文字認識の対象となった文書(帳票)の入力が終
わったかどうかを検査し(ステップS130)、終わっ
ていなければ次の文書(帳票)を読み込むためにステッ
プS110へ戻る。結果記憶手段45に登録されている
各帳票ごとに、各認識項目の代表値を次のようにして計
算して、結果記憶手段45へ追加登録する(ステップS
140)。 (A)認識項目内の各文字の1位の候補文字の確信度の
最小値とする。 (B)認識項目内の各文字の1位の候補文字の確信度の
平均値とする。 項目設定記憶手段25に登録されている認識項目の項目
名、領域位置等を表示させて、その内のどの項目が重要
なものであって、どの項目を優先的に修正しなければな
らないかの優先順位をユーザーに指示させ、その順番を
項目設定記憶手段20へ追加登録する(ステップS15
0)。認識結果の修正をどのような順番で行えば、効率
よく修正できるかの順番を決め、その修正する帳票の順
序を結果記憶手段45の帳票ヘッダーの項目「順序」に
格納する(ステップS160)。これは、項目設定記憶
手段25に記憶された認識項目の優先順位をソートの優
先キーとみなして、認識項目の代表値の小さい順にソー
トする。
(2) Processing Flow FIG. 8 is a flowchart for explaining the processing flow of the character recognition device of this embodiment. The form template is read by an image input device such as a scanner, and is displayed on a display device such as a display.
The user is caused to specify where the recognition item area of the form for character recognition is located (step S100). The designated area is registered in the item setting storage unit 25 for each recognition item. One document (form) is directly read as image data from an image input device such as a scanner or a copying machine (step S110). Alternatively, the document may be read from the image input device, written as a file in the storage device, and read from the file as one image data. From one piece of image data, individual character images are cut out for each recognition area set in the item setting storage unit 25,
The size is normalized, the feature amount of the normalized character image is extracted, and the feature amount is compared with the recognition dictionary,
A certain number of candidate characters are obtained in ascending order of certainty as the probability of recognition, and the candidate characters and their certainty are registered in the result storage unit 45 as recognition results (step S12).
0). It is checked whether or not the input of the document (form) subjected to character recognition has been completed (step S130), and if not, the process returns to step S110 to read the next document (form). For each form registered in the result storage means 45, the representative value of each recognition item is calculated as follows, and additionally registered in the result storage means 45 (step S).
140). (A) The minimum value of the certainty factor of the first candidate character of each character in the recognition item. (B) The average value of the degrees of certainty of the first candidate character of each character in the recognition item. The item names, area positions, and the like of the recognition items registered in the item setting storage means 25 are displayed to determine which items are important and which items need to be corrected with priority. The user is instructed on the priority order, and the order is additionally registered in the item setting storage unit 20 (step S15).
0). The order in which the correction of the recognition result is performed and the correction can be performed efficiently is determined, and the order of the form to be corrected is stored in the item “order” of the form header of the result storage unit 45 (step S160). In this case, the priority of the recognition items stored in the item setting storage unit 25 is regarded as a sorting priority key, and the items are sorted in ascending order of the representative value of the recognition items.

【0020】このソートにおいて、代表値に同じ値が存
在するときには、以下のいずれかの処理をする。 (A)次の優先順位の認識項目の代表値で順番を決定す
る。 (B)同じ値を示した認識項目に対する他の代表値で大
小で順番を決定する。 (C)上記いずれでも決まらないときには、入力した文
書(帳票)の順番や認識項目の文字数のような別の基準
を使って順番を決定する。 このような準備を行った後、ユーザーは文字認識された
結果の候補文字を確定する修正作業を行う(ステップS
170)。確定作業は、下位の候補文字の中から選択す
るか新たにユーザーが入力して、1位の候補文字と置き
換えて結果記憶手段45が修正される。このとき作業状
況を示すために、ユーザーはメニュー等で指定して以下
のようなある認識項目についの作業状況をディスプレイ
等の表示装置へ表示させる。また、このような作業状況
は、修正作業に入ったとき常に表示させておいてもよ
い。 (A)その項目の代表値が帳票全体でどのように推移状
況(グラフ) (B)現在修正している帳票の最初からの枚数(数値と
グラフ上の位置) (C)その帳票のこの項目に関する代表値の値(数値と
グラフ) (D)同じ値の代表値を持つ帳票の枚数(数値) 修正作業が終わった時には、結果記憶手段45の各認識
項目に対する1位の候補文字が文字認識処理の結果とな
っている。
In this sorting, when the same value exists as the representative value, one of the following processes is performed. (A) The order is determined based on the representative value of the next priority recognition item. (B) The order is determined based on the other representative values for the recognition items having the same value, in descending order. (C) If none of the above is used, the order is determined using another criterion such as the order of the input document (form) or the number of characters of the recognition item. After making such preparations, the user performs a correction operation to determine candidate characters as a result of character recognition (step S).
170). In the confirmation operation, the result storage means 45 is modified by selecting from lower candidate characters or newly inputting by the user, replacing the candidate character with the first candidate character. At this time, in order to indicate the work status, the user designates the work status with a menu or the like, and causes the display device such as a display to display the work status for a certain recognition item as follows. Such a work situation may be always displayed when the correction work is started. (A) How the representative value of the item changes over the entire form (graph) (B) Number of sheets from the beginning of the form currently being corrected (numerical value and position on the graph) (C) This item of the form (D) Number of forms having the same representative value (numerical value) When the correction work is completed, the first candidate character for each recognition item in the result storage unit 45 is character recognition. The result of the processing.

【0021】<コンピュータによる実施例>さらに、本
発明は上記の実施の形態のみに限定されたものではな
い。例えば、図1の文字認識装置は、図9に示したよう
なコンピュータ装置の構成によっても実現が可能であ
る。図9のコンピュータ装置は、入力装置1、出力装置
2、CPU(Central Processing Unit;中央処理装
置)3、メモリ4、記憶装置5、媒体駆動装置6および
ネットワーク接続装置7を備え、それらはバス8により
互いに接続されている。入力装置1は、キーボード、マ
ウス、タッチパネル、スキャナ等により構成され、テキ
ストや画像の情報を入力するのに使用される。出力装置
2は、種々の出力情報や入力装置1からの入力された情
報などを出力させるものであって、ディスプレイ装置や
プリンタ装置である。CPU3は、種々のプログラムを
動作させる。メモリ4は、プログラム自身を保持し、ま
たそのプログラムがCPU3によって実行されるときに
一時的に作成される情報等を保持する。記憶装置5は、
本発明の文字認識装置で扱う項目設定記憶手段25、結
果記憶手段45や文字認識用の辞書、読み込んだ画像デ
ータおよびプログラムやプログラム実行時の一時的な情
報等を保持する。媒体駆動装置6は、プログラムやデー
タ等を記憶した記録媒体を装着してそれらを読み込み、
メモリ4または記憶装置5へ格納するのに用いられる。
また、直接データの入出力やプログラム実行するのに使
ってもよい。
<Example by Computer> Further, the present invention is not limited to only the above-described embodiment. For example, the character recognition device of FIG. 1 can be realized by the configuration of a computer device as shown in FIG. 9 includes an input device 1, an output device 2, a CPU (Central Processing Unit) 3, a memory 4, a storage device 5, a medium drive device 6, and a network connection device 7. Are connected to each other. The input device 1 includes a keyboard, a mouse, a touch panel, a scanner, and the like, and is used to input text and image information. The output device 2 outputs various output information, information input from the input device 1, and the like, and is a display device or a printer device. The CPU 3 operates various programs. The memory 4 holds the program itself, and also holds information temporarily created when the program is executed by the CPU 3. The storage device 5
The item setting storage unit 25, the result storage unit 45, the dictionary for character recognition, the read image data, the program, and the temporary information when the program is executed are stored in the character recognition apparatus of the present invention. The medium drive device 6 loads a recording medium storing programs, data, and the like and reads them,
It is used for storing in the memory 4 or the storage device 5.
Further, it may be used for directly inputting / outputting data or executing a program.

【0022】尚、記録媒体としては半導体媒体(例え
ば、ROM、ICメモリカード等)、光媒体(例えば、
DVD、MO、MD、CD−R等)、磁気媒体(例え
ば、磁気テープ、フレキシブルディスク等)のいずれで
あってもよい。図1に示した文字認識装置を構成する各
機能をそれぞれプログラム化し、予めCD−ROM等の
記録媒体に書き込んでおき、このCD−ROMをCD−
ROMドライブのような媒体駆動装置6を搭載したコン
ピュータに装着して、これらのプログラムをそれぞれの
コンピュータ装置のメモリ4あるいは記憶装置5に格納
し、それを実行することによって、上述した実施の形態
と同様な機能を実現することができる。また、ロードし
たプログラムを実行することにより前述した実施の形態
の機能が実現されるだけでなく、そのプログラムの指示
に基づき、オペレーティングシステム等が実際の処理の
一部または全部を行い、その処理によって上述した実施
の形態の機能が実現される場合も含まれる。また、上述
した実施の形態を実現するプログラムがROM等のよう
な半導体の記録媒体である場合には、媒体駆動装置6か
らではなく、直接、メモリ4へロードして実行される。
さらに、上述した実施の形態の機能を実現するプログラ
ムが、機能拡張ボードや機能拡張ユニットに備わるメモ
リにロードされ、そのプログラムの指示に基づき、その
機能拡張ボードや機能拡張ユニットに備わるCPUなど
が実際の処理の一部または全部を行い、その処理によっ
て、上述した実施の形態の機能が実現される場合も含ま
れる。
As a recording medium, a semiconductor medium (for example, ROM, IC memory card, etc.), an optical medium (for example, ROM,
DVD, MO, MD, CD-R, etc.) and magnetic media (for example, magnetic tape, flexible disk, etc.). Each function of the character recognition apparatus shown in FIG. 1 is programmed and written in advance on a recording medium such as a CD-ROM.
By installing these programs in a computer equipped with a medium drive device 6 such as a ROM drive, and storing these programs in the memory 4 or the storage device 5 of each computer device, and executing them, A similar function can be realized. Further, not only the functions of the above-described embodiments are realized by executing the loaded program, but also the operating system or the like performs part or all of the actual processing based on the instructions of the program, and the processing performs The case where the functions of the above-described embodiments are realized is also included. Further, when the program for realizing the above-described embodiment is a semiconductor recording medium such as a ROM, the program is directly loaded into the memory 4 and executed not from the medium driving device 6.
Further, a program for realizing the functions of the above-described embodiment is loaded into the memory provided on the function expansion board or the function expansion unit, and the CPU or the like provided on the function expansion board or the function expansion unit is actually executed based on the instructions of the program. And a part of the entire process is performed, and the function of the above-described embodiment is realized by the process.

【0023】<本発明のネットワーク環境での運用>図
10は、本発明をネットワーク接続して運用する形態の
構成を示している。この場合、ユーザーの端末110お
よびサーバー120は、図9に示した汎用のコンピュー
タ装置で構成され、ネットワーク9に接続するためのネ
ットワーク接続装置7をそれぞれ備えるようにする。ま
た、このネットワーク9は、これらのユーザーの端末1
10とサーバー120とを結合するための伝送路であっ
て、一般には、ケーブルで実現され、通信プロトコルに
はTCP/IPが使われる。但し、伝送路としてはケー
ブルだけではなく、それらの間の通信プロトコルが一致
するものであれば無線LANや放送波を使ったものであ
ってもよい。サーバー120には、磁気ディスク等の記
憶装置に本発明の機能を実現する文字認識プログラムを
格納しておく。ユーザーの端末110では、サーバー1
20からその文字認識プログラムを受信して、画像を入
力し、受信した文字認識プログラムを端末110で実行
させ、その実行結果を出力するようにする。このように
することで、文字認識プログラムが常に最新のものを使
え、認識辞書はユーザー固有のものとすることができる
という利点がある。また、サーバー120から端末11
0とをネットワーク9で接続し、ダウンロード等の形式
で頒布することも可能である。さらに、本発明の機能を
実現するプログラムを放送波によって配布することで提
供するようにしてもよい。
<Operation in Network Environment of the Present Invention> FIG. 10 shows a configuration of an embodiment in which the present invention is connected to a network and operated. In this case, the user terminal 110 and the server 120 are configured by the general-purpose computer devices shown in FIG. 9 and include the network connection devices 7 for connecting to the network 9. Also, this network 9 is a terminal 1 of these users.
This is a transmission line for connecting the server 10 and the server 120, and is generally realized by a cable, and TCP / IP is used as a communication protocol. However, the transmission path is not limited to the cable, and may use a wireless LAN or a broadcast wave as long as the communication protocol between them is the same. The server 120 stores a character recognition program for realizing the functions of the present invention in a storage device such as a magnetic disk. On the user terminal 110, the server 1
The character recognition program is received from the terminal 20, an image is input, the terminal 110 executes the received character recognition program, and outputs the execution result. This has the advantage that the latest character recognition program can always be used, and the recognition dictionary can be unique to the user. In addition, the server 11 sends the terminal 11
0 can be connected via the network 9 and distributed in a form such as download. Further, the program for realizing the functions of the present invention may be provided by distributing it by broadcast waves.

【0024】[0024]

【発明の効果】以上説明したように、本発明によれば、
大量の原稿(帳票)が入力された場合であっても、文字
認識結果を効率よく修正する作業が行える。
As described above, according to the present invention,
Even when a large number of originals (forms) are input, it is possible to efficiently correct the character recognition result.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例である文字認識装置の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a character recognition device according to an embodiment of the present invention.

【図2】項目設定記憶手段のデータ構造を説明するため
の図である。
FIG. 2 is a diagram for explaining a data structure of an item setting storage unit.

【図3】結果記憶手段のデータ構造を説明するための図
である。
FIG. 3 is a diagram for explaining a data structure of a result storage unit.

【図4】代表値(最小値)の計算方法を説明するための
図である。
FIG. 4 is a diagram for explaining a method of calculating a representative value (minimum value).

【図5】代表値(平均値)の計算方法を説明するための
図である。
FIG. 5 is a diagram for explaining a method of calculating a representative value (average value).

【図6】状況表示手段で表示される画面例を示す図であ
る。
FIG. 6 is a diagram showing an example of a screen displayed by the status display means.

【図7】状況表示されたときの作業の負荷状況を説明す
るための図である。
FIG. 7 is a diagram for explaining a work load situation when a situation is displayed.

【図8】実施例の文字認識装置の処理を説明するための
フローチャートである。
FIG. 8 is a flowchart for explaining processing of the character recognition device of the embodiment.

【図9】本発明の文字認識装置をコンピュータで実現す
るときのハードウェアの構成を示す図である。
FIG. 9 is a diagram illustrating a hardware configuration when the character recognition device of the present invention is implemented by a computer.

【図10】本発明をネットワークで運用する形態の構成
を示す図である。
FIG. 10 is a diagram showing a configuration of a mode in which the present invention is operated on a network.

【符号の説明】[Explanation of symbols]

1 入力装置 2 出力装置 3 CPU 4 メモリ 5 記憶装置 6 媒体駆動装置 7 ネットワーク接続装置 8 バス 9 ネットワーク 10 制御手段 20 項目設定手段 25 項目設定記憶手段 30 画像入力手段 40 文字認識手段 45 結果記憶手段 50 代表値計算手段 60 優先順位指示手段 70 修正順位決定手段 80 状況表示手段 110 端末 120 サーバー DESCRIPTION OF SYMBOLS 1 Input device 2 Output device 3 CPU 4 Memory 5 Storage device 6 Medium drive device 7 Network connection device 8 Bus 9 Network 10 Control means 20 Item setting means 25 Item setting storage means 30 Image input means 40 Character recognition means 45 Result storage means 50 Representative value calculating means 60 priority order indicating means 70 correction order determining means 80 status display means 110 terminal 120 server

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 1つ以上の認識項目を含む帳票を画像デ
ータとして複数枚入力した画像の前記各帳票内の各認識
項目中の文字の認識結果と確からしさの情報を求める文
字認識装置において、 前記認識結果の確からしさの情報から前記各帳票内の各
認識項目の代表値を求める代表値計算手段と、前記帳票
内の各認識項目の認識結果を修正する優先順位を指示す
る優先順位指示手段と、該優先順位指示手段で指示され
た優先順位にしたがって、前記代表値計算手段で求めら
れた各認識項目の代表値をもとに、認識結果を修正する
帳票の順番を決定する修正順序決定手段とを備えたこと
を特徴とする認識結果修正装置。
1. A character recognition apparatus for obtaining information on the recognition result and certainty of characters in each of the recognition items in each of the forms of an image in which a plurality of forms including one or more recognition items are input as image data, Representative value calculating means for obtaining a representative value of each recognition item in each form from information on the likelihood of the recognition result, and priority order indicating means for indicating a priority for correcting the recognition result of each recognition item in the form Determining a correction order for correcting a recognition result based on the representative value of each recognition item obtained by the representative value calculating means in accordance with the priority specified by the priority specifying means. Means for correcting a recognition result.
【請求項2】 請求項1記載の認識結果修正装置におい
て、 前記修正順序決定手段は、前記優先順位指示手段で指示
された認識項目の優先順位をソートキーの優先順位と
し、その認識項目の代表値をソートすることによって修
正する帳票の順番を決定するようにしたこと特徴とする
認識結果修正装置。
2. The recognition result correcting apparatus according to claim 1, wherein the correction order determining means sets a priority of the recognition item designated by the priority designating means as a priority of the sort key, and a representative value of the recognition item. Wherein the order of forms to be corrected is determined by sorting the forms.
【請求項3】 請求項2記載の認識結果修正装置におい
て、 前記修正順序決定手段は、同じ値の代表値が複数存在す
る場合は、その同じ代表値を持つ帳票について、次の優
先順位の認識項目の代表値でソートすることによって、
修正する帳票の順番を決定するようにしたことを特徴と
する認識結果修正装置。
3. The recognition result correcting apparatus according to claim 2, wherein when there are a plurality of representative values having the same value, the correction order determining means recognizes the next priority of the form having the same representative value. By sorting by the representative value of the item,
A recognition result correcting apparatus, wherein the order of a form to be corrected is determined.
【請求項4】 請求項2記載の認識結果修正装置におい
て、 前記修正順序決定手段は、同じ値の代表値が複数存在す
る場合は、その同じ代表値を持つ帳票について、その認
識項目の他の代表値でソートすることによって、修正す
る帳票の順番を決定するようにしたことを特徴とする認
識結果修正装置。
4. The recognition result correcting apparatus according to claim 2, wherein, when there are a plurality of representative values having the same value, the correction order determining unit determines, for a form having the same representative value, another form having the same representative value. A recognition result correcting apparatus, wherein the order of a form to be corrected is determined by sorting by a representative value.
【請求項5】 請求項1乃至請求項4のいずれか1つに
記載の認識結果修正装置において、 前記代表値計算手段は、前記認識項目内の各文字の確か
らしさ情報の最小値および/または平均値を代表値とし
て計算することを特徴とする認識結果修正装置。
5. The recognition result correcting apparatus according to claim 1, wherein said representative value calculation means includes a minimum value of certainty information of each character in said recognition item and / or A recognition result correction device, wherein an average value is calculated as a representative value.
【請求項6】 請求項1乃至請求項5のいずれか1つに
記載の認識結果修正装置おいて、修正対象となる認識項
目の代表値の推移と現在修正している帳票との関係を表
示する状態表示手段を備えることを特徴とする認識結果
修正装置。
6. A recognition result correcting apparatus according to claim 1, wherein a transition between a representative value of a recognition item to be corrected and a form currently being corrected is displayed. 1. A recognition result correcting apparatus comprising:
【請求項7】 1つ以上の認識項目を含む帳票を画像デ
ータとして複数枚入力した画像の前記各帳票内の各認識
項目中の文字の認識結果と確からしさの情報を求める文
字認識方法において、 前記認識結果の確からしさの情報から前記各帳票内の各
認識項目の代表値を求め、前記帳票内の各認識項目の認
識結果を修正する優先順位を指示し、この指示された優
先順位をソートキーの優先順位とし、その認識項目の代
表値をソートすることによって修正する帳票の順番を決
定することを特徴とする認識結果修正方法。
7. A character recognition method for obtaining information on a recognition result and certainty of a character in each recognition item in each form of an image in which a plurality of forms including one or more recognition items is input as image data, From the information on the likelihood of the recognition result, a representative value of each recognition item in each form is obtained, a priority order for correcting the recognition result of each recognition item in the form is designated, and the designated priority is sorted by a sort key. And determining the order of the form to be corrected by sorting the representative values of the recognition items.
【請求項8】 請求項7記載の認識結果修正方法におい
て、 代表値でソートする際、同じ値の代表値が複数存在する
場合は、その同じ代表値を持つ帳票について、次の優先
順位の認識項目の代表値でソートすることによって、修
正する帳票の順番を決定するようにしたことを特徴とす
る認識結果修正方法。
8. The recognition result correcting method according to claim 7, wherein when sorting by a representative value, when there are a plurality of representative values of the same value, a form having the same representative value is recognized in the next priority order. A method of correcting a recognition result, wherein the order of a form to be corrected is determined by sorting by a representative value of an item.
【請求項9】 請求項7記載の認識結果修正装置におい
て、 代表値でソートする際、同じ値の代表値が複数存在する
場合は、その同じ代表値を持つ帳票について、その認識
項目の他の代表値でソートすることによって、修正する
帳票の順番を決定するようにしたことを特徴とする認識
結果修正方法。
9. The recognition result correcting apparatus according to claim 7, wherein when sorting by a representative value, when there are a plurality of representative values of the same value, a form having the same representative value is replaced with another one of the recognition items. A method of correcting a recognition result, wherein the order of a form to be corrected is determined by sorting by a representative value.
【請求項10】 請求項7乃至請求項9のいずれか1つ
に記載の認識結果修正方法において、修正対象となる認
識項目の代表値の推移と現在修正している帳票との関係
を表示して、現在の修正状態を表示することを特徴とす
る認識結果修正方法。
10. The method of correcting a recognition result according to claim 7, wherein a relation between a transition of a representative value of a recognition item to be corrected and a form currently being corrected is displayed. And displaying a current correction state.
【請求項11】 請求項1乃至請求項6のいずれか1つ
に記載の認識結果修正装置の機能を実現させるためのプ
ログラムを記録したことを特徴とするコンピュータで読
み込み可能な記録媒体。
11. A computer-readable recording medium having recorded thereon a program for realizing the function of the recognition result correcting apparatus according to claim 1. Description:
JP2001077278A 2001-03-16 2001-03-16 Recognition result correcting apparatus, recognition result correcting method, and recording medium Expired - Fee Related JP4299977B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001077278A JP4299977B2 (en) 2001-03-16 2001-03-16 Recognition result correcting apparatus, recognition result correcting method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001077278A JP4299977B2 (en) 2001-03-16 2001-03-16 Recognition result correcting apparatus, recognition result correcting method, and recording medium

Publications (2)

Publication Number Publication Date
JP2002279343A true JP2002279343A (en) 2002-09-27
JP4299977B2 JP4299977B2 (en) 2009-07-22

Family

ID=18934059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001077278A Expired - Fee Related JP4299977B2 (en) 2001-03-16 2001-03-16 Recognition result correcting apparatus, recognition result correcting method, and recording medium

Country Status (1)

Country Link
JP (1) JP4299977B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204806A (en) * 2009-03-02 2010-09-16 Oki Electric Ind Co Ltd Information processor, document processing system, and document processing method
KR20160124775A (en) * 2014-02-20 2016-10-28 케이엘에이-텐코 코포레이션 Signal response metrology for image based overlay measurements
JP2020042316A (en) * 2018-09-06 2020-03-19 富士ゼロックス株式会社 Information processing apparatus and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204806A (en) * 2009-03-02 2010-09-16 Oki Electric Ind Co Ltd Information processor, document processing system, and document processing method
KR20160124775A (en) * 2014-02-20 2016-10-28 케이엘에이-텐코 코포레이션 Signal response metrology for image based overlay measurements
KR102184029B1 (en) 2014-02-20 2020-11-27 케이엘에이 코포레이션 Signal response metrology for image based overlay measurements
JP2020042316A (en) * 2018-09-06 2020-03-19 富士ゼロックス株式会社 Information processing apparatus and program
JP7268311B2 (en) 2018-09-06 2023-05-08 富士フイルムビジネスイノベーション株式会社 Information processing device and program

Also Published As

Publication number Publication date
JP4299977B2 (en) 2009-07-22

Similar Documents

Publication Publication Date Title
JP2699998B2 (en) Data acquisition variable priority method and system for managing fluctuating processing power
JP7013182B2 (en) Information processing equipment, information processing methods and programs
US20090110282A1 (en) Image recognition apparatus, image recognition method, and storage medium recording image recognition program
JP2009122722A (en) Document recognizing program, document recognizing apparatus and document recognizing method
JP2019144759A (en) Image processing apparatus, image processing apparatus control method, and program
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US8577826B2 (en) Automated document separation
JP2002279343A (en) Recognition result correction device and method, and recording medium
JP2020087112A (en) Document processing apparatus and document processing method
JP2000020421A (en) Method for automatically selecting template in electronic mail system
JP2002099555A (en) Apparatus and method for document classification
US20200273462A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2008176764A (en) Image processing system, image processing method and image processing program
JP4791641B2 (en) Candidate character output device, candidate character output method, program, and computer-readable recording medium
JP2002279353A (en) Character recognition device, method therefor, and recording medium
JP2000305687A (en) Interactive display device
JP2004259076A (en) Picture recognizing method and device
JP2002279352A (en) Character recognition device and method, and recording medium
JP2000132635A (en) Recognizing data confirming method
JPH10171917A (en) Device and method for character recognition and its recording medium
JP2006178543A (en) Image processing method and image processor
JP3077580B2 (en) Character reader
JP2002014981A (en) Document filing device
JPH08212287A (en) Data control system and data processing method
JP2000293623A (en) Character recognizing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060327

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060427

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090420

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140424

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees