JP2006172070A - Ledger sheet processor, ledger sheet processing method and ledger sheet processing program - Google Patents
Ledger sheet processor, ledger sheet processing method and ledger sheet processing program Download PDFInfo
- Publication number
- JP2006172070A JP2006172070A JP2004362648A JP2004362648A JP2006172070A JP 2006172070 A JP2006172070 A JP 2006172070A JP 2004362648 A JP2004362648 A JP 2004362648A JP 2004362648 A JP2004362648 A JP 2004362648A JP 2006172070 A JP2006172070 A JP 2006172070A
- Authority
- JP
- Japan
- Prior art keywords
- character
- attribute
- recognition result
- recognition
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、帳票の処理を行う帳票処理装置、帳票処理方法、及び帳票処理プログラムに関する。 The present invention relates to a form processing apparatus that performs form processing, a form processing method, and a form processing program.
従来、帳票上のイメージを読み取って文字認識処理を行う帳票処理装置では、帳票上の文字記入枠により複数の領域として区画された各フィールドに各々対応するように、各フィールドに記入されるべき文字の属性情報が予め定義されている。すなわち、フィールド毎に対応する文字の属性情報とは、例えば、氏名欄であるならば漢字、フリガナ欄であるならはカタカナ、番号欄であるならば数字といったものである。 Conventionally, in a form processing apparatus that performs character recognition processing by reading an image on a form, characters to be entered in each field so as to correspond to each field divided into a plurality of areas by a character entry frame on the form. Attribute information is defined in advance. That is, the character attribute information corresponding to each field is, for example, kanji for the name column, katakana for the reading column, and numbers for the number column.
帳票処理装置では、このような属性情報を利用して、氏名欄では漢字認識、フリガナ欄ではカタカナ認識、数字欄ならば数字認識を行って、その認識結果をディスプレイ上に出力し、例えば認識結果に誤りがある場合にはGUI(Graphical User Interface)などを通じてオペレータが修正処理を行うことが一般的である。 The form processing apparatus uses such attribute information to recognize kanji in the name field, katakana recognition in the reading field, and number recognition in the number field, and output the recognition result on the display. For example, the recognition result When there is an error, the operator generally performs correction processing through a GUI (Graphical User Interface) or the like.
ここで、帳票に文字を印刷する際に、例えばプリンタへの帳票の位置決めにズレなどが生じた場合には、帳票上の所定のフィールドに実際に印字された文字の属性と、予めフィールドに定義された文字の属性とにズレが生じる場合がある。そこで、このような場合でも、正しい文字認識結果が得られるように、フィールドに定義された文字属性の設定変更や認識対象のフィールドサイズの設定変更を可能とした文字認識装置が提案されている(例えば、特許文献1参照)。
しかしながら、このような従来の装置では、例えば、文字の認識結果が正しくて得られたとしても、認識結果としてその文字が対応付けられたフィールドと、その文字が実際に対応付けられるべき正規のフィールドとの対応関係に誤りが生じているおそれがある。さらに、この従来の装置では、上述した文字属性の設定変更やフィールドサイズの設定変更を行うために、人為的な設定操作が必要となり、オペレータの作業を増加させる要因となっている。 However, in such a conventional apparatus, for example, even if a character recognition result is obtained correctly, a field to which the character is associated as a recognition result and a normal field to which the character is to be actually associated There may be an error in the correspondence with. Further, in this conventional apparatus, in order to change the setting of the character attribute and the setting of the field size described above, an artificial setting operation is required, which increases the operator's work.
そこで本発明は、上記課題を解決するためになされたもので、帳票の文字認識結果における文字属性の修正処理を迅速且つ容易に行えるようにすることで、ユーザ側の負担を軽減させ帳票の処理効率を向上させることができる帳票処理装置、帳票処理方法、及び帳票処理プログラムの提供を目的とする。 Accordingly, the present invention has been made to solve the above-described problems, and by making it possible to quickly and easily perform the correction processing of the character attribute in the character recognition result of the form, the burden on the user side can be reduced and the form processing can be performed. It is an object of the present invention to provide a form processing apparatus, a form processing method, and a form processing program that can improve efficiency.
上記目的を達成するために、本発明に係る帳票処理装置は、帳票上に設けられた文字記入枠によって複数に区画された領域に対し記録されるべき文字の属性情報を定義し、この属性情報を各領域毎に対応付けて記憶する属性情報記憶手段と、帳票イメージを入力し、文字認識を行う文字認識手段と、前記文字認識手段による認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、前記属性情報記憶手段の記憶内容に基づき判定する認識結果判定手段と、前記認識結果判定手段による判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定手段と、前記修正内容推定手段により推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示手段と、を具備することを特徴とする。 In order to achieve the above object, the form processing apparatus according to the present invention defines character attribute information to be recorded for a plurality of areas divided by character entry frames provided on the form. Attribute information storage means for storing each area in association with each other, a character recognition means for inputting a form image and performing character recognition, and at least each of the character entry boxes obtained as a recognition result by the character recognition means Recognition result determination means for determining whether the correspondence between the attribute of the area and the attribute of the character is correct or not based on the storage contents of the attribute information storage means, and the attribute of the area and the attribute of the character as a determination result by the recognition result determination means When there is a contradiction in the correspondence relationship, the correction content estimation means for estimating the correction content of the recognition result capable of matching the correspondence relation, and the correction content estimation means The contents correcting the recognition result, characterized by comprising a display means for visually displaying, as recommended correction data.
すなわち、本発明では、帳票のイメージが入力され、文字記入枠内の各領域毎の文字認識結果が得られると、この認識結果として得られた文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、予め領域毎に定義された文字の属性情報に基づいて判定する。さらに、本発明では、認識された文字の属性と予め定義された正規の領域の属性との対応関係に例えば矛盾が生じる認識結果が得られてしまうような場合でも、領域の属性と文字の属性との対応関係の修正処理を行い、誤りが生じている認識結果を修正した推奨修正データを表示させることができる。したがって、本発明によれば、帳票の文字認識結果における文字属性の修正処理が迅速且つ容易に実現されるので、ユーザ側の負担が軽減され、帳票の処理の効率化を図ることができる。 That is, in the present invention, when a form image is input and a character recognition result is obtained for each area in the character entry frame, the attribute of each area and the character attribute in the character entry frame obtained as the recognition result are obtained. Is determined based on character attribute information defined in advance for each area. Furthermore, in the present invention, even if a recognition result in which a contradiction occurs, for example, in a correspondence relationship between the recognized character attribute and the predefined regular region attribute, the region attribute and the character attribute is obtained. The recommended correction data obtained by correcting the recognition result in which an error has occurred can be displayed. Therefore, according to the present invention, the correction processing of the character attribute in the character recognition result of the form can be realized quickly and easily, so that the burden on the user side is reduced and the efficiency of the form processing can be improved.
また、本発明においては、前記表示手段が、前記文字認識手段による認識結果を前記推奨修正データで更新することへの了承/拒否に対応した情報入力を促す選択情報を表示するものであってもよい。この場合、ユーザにとって入力操作の容易な情報の選択操作のみで、正しく修正された文字認識結果を電子データとして記憶保持させることができる。 In the present invention, the display means may display selection information for prompting information input corresponding to approval / rejection to update the recognition result by the character recognition means with the recommended correction data. Good. In this case, the character recognition result corrected correctly can be stored and held as electronic data only by an information selection operation that is easy for the user to input.
さらに、本発明の帳票処理方法は、文字記入枠に文字が記録された帳票から読み取られたイメージを入力し、文字認識を行う文字認識ステップと、前記文字認識ステップで認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、帳票上に予め記された文字記入枠によって複数に区画された領域に対し記入されるべき文字の属性情報を定義し且つ該属性情報を各領域毎に対応付けて記憶する記憶装置の記憶内容に基づいて、判定する認識結果判定ステップと、前記認識結果判定ステップでの判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定ステップと、前記修正内容推定ステップで推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示ステップと、を有することを特徴とする。 Furthermore, the form processing method of the present invention is a method for inputting an image read from a form in which characters are recorded in a character entry frame and performing character recognition, and at least the recognition result obtained in the character recognition step. Whether the correspondence between the attribute of each area in the character entry frame and the attribute of the character is correct or not, attribute information of the character to be entered in a plurality of areas divided by the character entry frame previously written on the form A recognition result determination step for determining based on the storage contents of the storage device that defines and stores the attribute information in association with each region, and the attribute and character of the region as the determination result in the recognition result determination step When a contradiction occurs in the correspondence relationship with the attribute, a correction content estimation step for estimating a correction content of the recognition result that can match the correspondence relationship, and the correction content estimation step The estimated content modifies the recognition result-up, and having a display step of visually displaying, as recommended correction data.
また、本発明に係る帳票処理プログラムは、帳票の処理をコンピュータに実行させる帳票処理プログラムであって、前記コンピュータを、帳票上に設けられた文字記入枠によって複数に区画された領域に対し記録されるべき文字の属性情報を定義し、この属性情報を各領域毎に対応付けて記憶する属性情報記憶手段と、帳票イメージを入力し、文字認識を行う文字認識手段と、前記文字認識手段による認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、前記属性情報記憶手段の記憶内容に基づき判定する認識結果判定手段と、前記認識結果判定手段による判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定手段と、前記修正内容推定手段により推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示手段、として機能させることを特徴とする。 The form processing program according to the present invention is a form processing program for causing a computer to execute a form process, wherein the computer is recorded in a plurality of areas divided by character entry frames provided on the form. Attribute information storage means for defining attribute information of characters to be associated and storing the attribute information in association with each area, character recognition means for inputting a form image and performing character recognition, and recognition by the character recognition means A recognition result determining means for determining whether or not the correspondence relationship between the attribute of each area and the character attribute in at least the character entry frame obtained as a result is correct based on the storage content of the attribute information storage means; and the recognition result determination If there is a contradiction in the correspondence between the attribute of the area and the attribute of the character as a result of determination by the means, the recognition result that can match the correspondence The correction content estimation means for estimating the correction content of the information, and the display means for visually displaying the correction result of the recognition result estimated by the correction content estimation means as recommended correction data, .
このように、本発明によれば、帳票の文字認識結果における文字属性の修正処理を迅速且つ容易に行えるようにすることで、ユーザ側の負担を軽減させ帳票の処理効率を向上させることが可能な帳票処理装置、帳票処理方法、及び帳票処理プログラムを提供することができる。 As described above, according to the present invention, it is possible to reduce the burden on the user side and improve the processing efficiency of the form by enabling the correction processing of the character attribute in the character recognition result of the form to be performed quickly and easily. A form processing apparatus, form processing method, and form processing program can be provided.
以下、本発明を実施するための最良の形態を図面に基づき説明する。
図1は、本発明の実施形態に係る帳票処理装置の構成を機能的に示すブロック図、図2は、この帳票処理装置上で実行される帳票処理プログラムにより実現される各種機能をその処理の流れとともに示す図である。
図1及び図2に示すように、本実施形態の帳票処理装置1は、CPU2と、メインメモリ3と、記憶装置5と、ディスプレイ9と、キーボード10と、ポインティングデバイス6と、スキャナ8とを主に備える。ここで、本実施形態の帳票処理装置1では、スキャナ8を除く各種ハードウェアは、例えばPC(Personal Computer)などを含むコンピュータ装置によって実現されている。
The best mode for carrying out the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram functionally showing the configuration of a form processing apparatus according to an embodiment of the present invention, and FIG. 2 shows various functions realized by the form processing program executed on the form processing apparatus. It is a figure shown with a flow.
As shown in FIGS. 1 and 2, the
CPU2は、帳票処理装置全体の制御を司るもので、メインメモリ3上で実行される各種プログラムに従って、データの入出力制御、スキャナ8を通じて入力された帳票上のイメージからの文字認識処理及びその他の各種処理を行う。
The
メインメモリ3は、プログラムやデータなどが記憶される領域であって、各種プログラムに従って処理が実行される場合に、このプログラムの実行に伴って処理対象とするデータが一時的に記憶される。このメインメモリ3上では、帳票に記されたイメージの認識処理を行う帳票処理プログラム12aが実行される。また、帳票処理プログラム12aの実行に伴って記憶されるデータとしては、スキャナ8を通じて入力される帳票のイメージである原画像データ14、原画像データ14に対する文字認識処理によって得られる認識結果としての認識結果データ(文字コード)15などが記憶される。
The
ディスプレイ9は、LCD(Liquid Crystal Display)などにより構成され文字認識結果や装置の状態を示す情報を可視的(視覚的)に表示する。キーボード10は、帳票処理装置本体に対して各種の指示を入力するために用いられる。ポインティングデバイス6は、マウスやタブレットなどにより構成され、帳票処理装置に対して各種の指示を入力するために用いられる。スキャナ8は、文字認識処理の対象とする帳票上の画像をイメージとして読み取り、原画像データ14を出力する。
The display 9 is composed of an LCD (Liquid Crystal Display) or the like, and visually (visually) displays information indicating the character recognition result and the state of the apparatus. The
記憶装置5は、各種の記憶媒体に対してプログラムやデータなどの読み書きを実行する。記憶装置5は、記憶媒体として、ハードディスクなどの磁気ディスクや、光ディスク、半導体メモリなどを用いることができる。記憶媒体は、固定型、可搬型のいずれであってもよい。詳細には、記憶装置5には、メインメモリ3上で実行される帳票処理プログラム本体12が記憶されている。さらに、記憶装置5には、帳票上に予め記された文字記入枠によって複数に区画された領域であるフィールドに対し、記入されるべき文字の属性データ7が定義され且つこの属性データ7が各フィールドに対応付けて記憶されている。ここで、帳票処理装置1は、プリンタを備えて構成されていてもよい。例えばこのプリンタは、帳票の読み取り画像から得られた文字認識結果を紙媒体に印刷することなどを可能とするものである。
The
次に、メインメモリ3上で実行される帳票処理プログラム12aにより実現可能な各種機能(処理)を図2に基づき説明する。また、ここでは、帳票処理プログラム12aにより実現される後述するフィールド認識処理22の基本的な処理内容について説明を行う。
同図2に示すように、帳票処理プログラム12aは、スキャナ8によって帳票上からイメージとして読み取られた原画像21(原画像データ14)に対して処理を行うフィールド認識処理22と、フィールド属性情報検査処理23と、フィールド属性情報修正処理24と、推奨修正データ52をディスプレイ9に表示出力させる推奨修正データ表示出力処理25とを主に実現する。
Next, various functions (processes) that can be realized by the
As shown in FIG. 2, the
上記フィールド認識処理22は、さらに詳細には、ノイズ除去、二値化、フォームやプレプリント文字の除去、認識対象のフィールドの切り出しなどを行う前処理と、前処理結果により得られた画像から文字群を抽出する文字抽出処理と、抽出された文字群中の文字を認職し文字コードに変換する文字認識処理とを含む。
さらに、上記した文字抽出処理では、処理対象とする画像に対して横方向への射影を計算し、その値と最大値の比が予め定めた閾値以下になる場所を行の区切りとする。そして、区切られた行内で縦方向への射影を求め、その値と最大値の比が予め定めた閾値以下になる場所を文字の区切りとし、こうして求めた文字矩形の内部の画像を1文字分の文字画像とする。また、文字抽出処理は、ラベリングによる連結領域抽出として行うこともでき、ここで挙げた方法に限らず、文字の画像と位置が取得できる方法ならどのような方法を用いてもよい。
In more detail, the
Further, in the character extraction process described above, a projection in the horizontal direction is calculated for the image to be processed, and a place where the ratio between the value and the maximum value is equal to or less than a predetermined threshold is set as a line delimiter. Then, the projection in the vertical direction is obtained within the delimited line, and the place where the ratio of the value and the maximum value is equal to or less than a predetermined threshold is set as the character delimiter. Character image. The character extraction process can also be performed as a connected region extraction by labeling, and is not limited to the method described here, and any method may be used as long as it can acquire the image and position of the character.
また、文字認識処理は、文字抽出処理によって抽出された文字画像を複合類似度法や部分空間怯などの手法により、予め緩められたクラスの何れかに分類し、そのクラスに対応する文字コードを出力することにより文字認識を行う。文字認識処理では、基本的には入力された文字画像に対応する文字コードを出力するが、文字画像からでは判別が困難な文字についてはリジェクトコードを出力することもできる。また、複合類似度法や、部分空間法などの方法では、分類尺度となる類似度値をクラスの分類に用いているが、この類似度値を併せて出力してもよい。 In the character recognition process, the character image extracted by the character extraction process is classified into one of previously relaxed classes by a method such as a composite similarity method or a subspace 怯, and a character code corresponding to the class is classified. Character recognition is performed by outputting. In the character recognition process, a character code corresponding to the input character image is basically output, but a reject code can be output for a character that is difficult to distinguish from the character image. Further, in methods such as the composite similarity method and the subspace method, the similarity value that is a classification scale is used for class classification, but this similarity value may be output together.
次に、本実施形態の帳票処理装置1が行う帳票の文字認識結果における文字属性の修正処理を実現するための構成を上記図1、図2に加え、図3ないし図5に基づき詳述する。ここで、図3は、帳票処理装置1の記憶装置5に格納された上記属性データ7の内容を示す図、図4は、帳票処理装置1により処理される、文字記入枠34がプレ印刷された帳票30を示す図、図5は、帳票上のプレ印刷された文字記入枠34内に文字が印刷された状態を例示する図である。
Next, the configuration for realizing the character attribute correction processing in the form character recognition result performed by the
属性データ7は、図3ないし図5に示すように、帳票30上に予め記された文字記入枠34によって複数に区画された領域であるフィールド31、32、33に対し、記入されるべき文字の属性を定義し且つこの属性を各フィールド31、32、33に対応付けられた情報である。つまり、属性データ7は、図3に示すように、フィールドNoと、フィールドNoに各々関連付けられて記憶された座標位置、フィールド属性、関係などから主に構成される。座標位置には、帳票30上の例えば所定の基準位置からの座標位置情報が記憶されている。フィールド属性には、例えば、記号、英字、数字、カタカナ、漢字、ひらがな、色などを示す文字の属性情報が記憶されている。関係には、例えば、帳票30上に予め記された文字記入枠34によって複数に区画された各フィールドの位置関係(他のフィールドとの相対的な位置関係)などが例えばカラム情報などとして記憶されている。
As shown in FIGS. 3 to 5, the
ここで、本実施形態で適用されている帳票30のフォーマットを図4及び図5に基づき概略的に説明する。
図4に示すように、文字記入枠34は、帳票30上に予めプレ印刷されている。この文字記入枠34によってそれぞれ区画されたフィールド31、32、33が予め定められた属性の文字を記入するための領域としてそれぞれ確保されている。ここで、図3にも示したように、フィールド31には数字属性、フィールド32にはカタカナ属性、フィールド33には漢字属性が予め与えられている(定義されている)。また、フィールド31には、プレ印字文字(番号)35が、フィールド32にはプレ印字文字(フリガナ)36が、フィールド33にはプレ印字文字(氏名)37が存在することも上記した属性データ7中に含まれている。
Here, the format of the
As shown in FIG. 4, the
さらに、上記したフィールド認識処理22、フィールド属性情報検査処理23、フィールド属性情報修正処理24、及び推奨修正データ表示出力処理25による一連の処理で実現される文字属性の修正に主に関連する処理内容を、図4、図5及び上記図2を参照しつつ説明を行う。
これらの図に示すように、フィールド認識処理22では、文字記入枠34に文字を記入した帳票30からスキャナ8を通じて読み取られたイメージを入力し、文字記入枠34内の各フィールド31、32、33毎に文字認識処理を行う。フィールド属性情報検査処理23では、フィールド認識処理22による認識結果として得られた文字記入枠34内の各領域と文字の属性との対応関係の正否を、記憶装置5内に記憶された属性データ7に基づき判定する。すなわち、フィールド属性情報検査処理23では、予めフィールド31、32、33毎に定義された文字の属性情報(例えば、漢字、カタカナ、英数字など)と、フィールド認識処理22で認識された結果とを比較照合(マッチング)することで、認識対象の文字が正しいフィールドに存在するか否かを判定する。
Furthermore, processing contents mainly related to correction of character attributes realized by a series of processes by the above-described
As shown in these drawings, in the
フィールド属性情報修正処理24では、フィールド属性情報検査処理23による判定結果としてフィールドと文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な認識結果の修正内容を推定する。つまり、フィールド属性情報修正処理24では、フィールド属性情報検査処理23による処理結果として、認識対象の文字が正しいフィールドに存在しないことが判明した場合、文字の属性情報が適合する正しいフィールドを検索し、検索したそのフィールドとフィールド認識処理22の認識結果を関連付ける。
In the field attribute
推奨修正データ表示出力処理25は、フィールド属性情報修正処理24により推定された認識結果を修正した内容を、推奨修正データ(後述する図7参照)として可視的に表示する処理である。すなわち、推奨修正データ表示出力処理25は、フィールド属性情報修正処理24により正しいフィールドに関連付けされた結果を、ディスプレイ9に表示させるための制御信号を出力する処理である。
The recommended correction data display
次に、帳票処理装置1上で実行される帳票処理プログラム12aによる具体的な処理を上記図3及び図5に加え、図6及び図7に基づいて説明する。ここで、図6は、帳票処理プログラム12aが行う処理を示すフローチャート、図7は、帳票処理装置1のディスプレイ9上に表示された推奨修正データ52を示す図である。
Next, specific processing by the
まず、フィールド認識処理22の結果のうち、本処理を行っていないフィールド認識結果が存在するか否かが調査される(S[ステップ]1)。未処理のフィールド認識結果が存在しない場合(S1のNo)、本処理は終了する。未処理のフィールド認識結果が存在する場合(S1のYes)、そのフィールド認識結果の読み込みを行う(S2)。ここで、本実施形態では、カタカナ39が、本来記載されるべきカタカナ属性を持ったフィールド32ではなく、漢字属性を持ったフィールド33に記載されている。また、フィールド認識処理22では、帳票30の文字記入枠34を認識することで、各フィールド31、32、33に記載されている文字が認識される。この場合、フィールド31には、プレ印字文字(番号)35が、フィールド32にはプレ印字文字(フリガナ)36が、フィールド33にはプレ印字文字(氏名)37が、それぞれ存在することを示す情報が属性データ7中に含まれているため、認識対象の文字とプレ印刷されたこれらの文字とは差別化される。
First, it is investigated whether there is a field recognition result that has not been subjected to this processing among the results of the field recognition processing 22 (S [step] 1). If there is no unprocessed field recognition result (No in S1), this process ends. When there is an unprocessed field recognition result (Yes in S1), the field recognition result is read (S2). Here, in this embodiment, the
次いで、読み込まれたフィールドの認識結果と、予め属性データ7で定義されたフィールドの文字の属性情報との比較照合が行われる(S3)。詳細には、図5に示すように、フィールド31に記入されている数字38「123456789」を例にとって説明すると、フィールド31に該当する属性情報が数字属性であるため、フィールド認識結果が正しく「123456789」という数字による文字列が得られたとするならば、どちらも数字属性となり、フィールドの認識結果が正しいと判定される(S3のYes)。
Next, the verification result of the read field is compared with the character attribute information of the field defined in advance in the attribute data 7 (S3). More specifically, as illustrated in FIG. 5, the
さらに、フィールド33に記載されているカタカナ39である「トウシバ タロウ」と漢字40である「東芝 太郎」とを処理する場合、まず、それぞれが個別に処理される。カタカナ39の認識結果が「トウシバ タロウ」として得られていたとする。ここで、フィールド33に該当する属性情報が漢字属性であるため、カタカナ39と矛盾したフィールド属性となり、正しくないと判定される(S3のNo)。次に、予め属性データ7で定義されたカタカナ属性を持ったフィールドが存在するか否かが検索される(S4)。図5及び図3に示すように、フィールド32のフィールドの属性情報がカタカナ属性として定義されているため(S4のYes)、カタカナ39は、フィールド33ではなく、フィールド32に属する文字であると判断される。この場合、カタカナ39とカタカナ属性で定義された正しいフィールド32との関連付けが行われ、図7に示すように、フィールド認識処理22で得られた認識結果51と、推奨修正データ表示出力処理25で得られた推奨修正データ(カタカナ39の認識位置をフィールド33からフィールド32移動させた修正内容)52と、推奨修正データ52の了承/拒否を選択入力可能な選択情報53とが、それぞれディスプレイ9上に可視的に表示される(S5)。
Further, when processing “Toshibata Taro” as
ここで、選択情報53は、フィールド認識処理22による認識結果51を推奨修正データ52で更新することへの了承/拒否に対応した情報入力をオペレータ(ユーザ)に促す入力ボタンである。ここで、選択情報53は、了承(OK)ボタン54及び拒否(Cancel)ボタン55をGUIで表示し、オペレータがマウスなどのポインティングデバイス6でいずれかのボタンをクリックすることで、推奨修正データ52での更新/非更新を選択することが可能となる。さらに、了承ボタン54の押下に連動して、更新を了承した推奨修正データ52が、記憶装置5などが備える例えば磁気ディスク媒体などに記憶保持される。
Here, the
また、例えば、表示された推奨修正データ52においても、文字とフィールドとの属性の対応関係に依然として誤りがある場合において、例えば、誤りのある文字列を正しいフィールド位置にポインティングデバイス6などを通じて移動させ手動での修正を行えるように帳票処理プログラム12aを構成してもよい。なお、認識結果とフィールドの属性情報とが整合する場合や(S3のYes)、周囲のフィールドに同じ属性情報を持つフィールドが存在しない場合には(S4のNo)、さらにS1において、認識処理を行っていない未処理のフィールドが存在しなくなるまで処理が継続される。
Also, for example, in the displayed recommended
既述したように、本実施形態に係る帳票処理装置1では、帳票30から読み取られたイメージを認識して得た文字の属性と予め定義された正規のフィールドの属性との対応関係に例えば矛盾が生じる認識結果51などが得られてしまうような場合(例えばフィールドの属性にマッチングしていない属性の文字が当該フィールドに記入されている場合)でも、フィールドの属性と文字の属性との対応関係の修正処理を行い、誤りが生じている認識結果を修正した推奨修正データ52を、ディスプレイ9上に表示させることができる。したがって、帳票処理装置1によれば、帳票の文字認識結果における文字属性の修正処理が迅速且つ容易に実現されるので、オペレータ側の負担が軽減され、帳票の処理の効率化を図ることができる。
As described above, in the
以上、本発明を実施の形態により具体的に説明したが、本発明は前記実施形態にのみ限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。例えば、上述した実施形態では、推奨修正データ52が、一種類だけ表示されるものであったが、これに代えて、互いに異なる推奨修正データを複数表示させ、その中からユーザに所望の候補を選択させるようにしてもよい。また、文字記入枠がプレ印刷された帳票以外の定型の紙葉類の処理装置を本発明として適用することなども可能である。
Although the present invention has been specifically described above by the embodiments, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the invention. For example, in the above-described embodiment, only one type of recommended
1…帳票処理装置、2…CPU、3…メインメモリ、5…記憶装置、8…スキャナ、9…ディスプレイ、7…属性データ、12…帳票処理プログラム本体、12a…帳票処理プログラム、22…フィールド認識処理、23…フィールド属性情報検査処理、24…フィールド属性情報修正処理、25…推奨修正データ表示出力処理、30…帳票、31,32,33…フィールド、34…文字記入枠、51…認識結果、52…推奨修正データ、53…選択情報、54…了承ボタン、55…拒否ボタン。
DESCRIPTION OF
Claims (6)
帳票イメージを入力し、文字認識を行う文字認識手段と、
前記文字認識手段による認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、前記属性情報記憶手段の記憶内容に基づき判定する認識結果判定手段と、
前記認識結果判定手段による判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定手段と、
前記修正内容推定手段により推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示手段と、
を具備することを特徴とする帳票処理装置。 Attribute information storage means for defining attribute information of characters to be recorded for a plurality of areas partitioned by a character entry frame provided on the form, and storing the attribute information in association with each area;
Character recognition means for inputting a form image and performing character recognition;
Recognition result determination means for determining whether or not the correspondence between at least the attribute of each area in the character entry frame and the attribute of the character obtained as a recognition result by the character recognition means is correct based on the storage contents of the attribute information storage means When,
When there is a contradiction in the correspondence between the attribute of the region and the attribute of the character as the determination result by the recognition result determination unit, the correction content estimation that estimates the correction content of the recognition result that can match the correspondence Means,
Display means for visually displaying the corrected contents of the recognition result estimated by the correction content estimation means as recommended correction data;
A form processing apparatus comprising:
前記文字認識ステップで認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、帳票上に予め記された文字記入枠によって複数に区画された領域に対し記入されるべき文字の属性情報を定義し且つ該属性情報を各領域毎に対応付けて記憶する記憶装置の記憶内容に基づいて、判定する認識結果判定ステップと、
前記認識結果判定ステップでの判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定ステップと、
前記修正内容推定ステップで推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示ステップと、
を有することを特徴とする帳票処理方法。 A character recognition step for inputting an image read from a form in which characters are recorded in a character entry frame and performing character recognition;
Whether or not the correspondence between at least the attribute of each area in the character entry frame and the attribute of the character obtained as a recognition result in the character recognition step is correct is divided into a plurality by a character entry frame previously written on the form A recognition result determination step for determining, based on the storage contents of a storage device that defines attribute information of characters to be entered for an area and stores the attribute information in association with each area;
If the correspondence between the attribute of the region and the attribute of the character is inconsistent as the determination result in the recognition result determination step, the correction content for estimating the correction content of the recognition result capable of matching the correspondence An estimation step;
A display step for visually displaying the corrected content of the recognition result estimated in the correction content estimation step as recommended correction data;
A form processing method characterized by comprising:
前記コンピュータを、
帳票上に設けられた文字記入枠によって複数に区画された領域に対し記録されるべき文字の属性情報を定義し、この属性情報を各領域毎に対応付けて記憶する属性情報記憶手段と、
帳票イメージを入力し、文字認識を行う文字認識手段と、
前記文字認識手段による認識結果として得られた少なくとも前記文字記入枠内の各領域の属性と文字の属性との対応関係の正否を、前記属性情報記憶手段の記憶内容に基づき判定する認識結果判定手段と、
前記認識結果判定手段による判定結果として前記領域の属性と文字の属性との対応関係に矛盾が生じた場合、当該対応関係を整合させることの可能な前記認識結果の修正内容を推定する修正内容推定手段と、
前記修正内容推定手段により推定された前記認識結果を修正した内容を、推奨修正データとして可視的に表示する表示手段、
として機能させることを特徴とする帳票処理プログラム。 A form processing program for causing a computer to execute form processing,
The computer,
Attribute information storage means for defining attribute information of characters to be recorded for a plurality of areas partitioned by a character entry frame provided on the form, and storing the attribute information in association with each area;
Character recognition means for inputting a form image and performing character recognition;
Recognition result determination means for determining whether or not the correspondence between at least the attribute of each area in the character entry frame and the attribute of the character obtained as a recognition result by the character recognition means is correct based on the storage contents of the attribute information storage means When,
When there is a contradiction in the correspondence between the attribute of the region and the attribute of the character as the determination result by the recognition result determination unit, the correction content estimation that estimates the correction content of the recognition result that can match the correspondence Means,
Display means for visually displaying the corrected contents of the recognition result estimated by the correction content estimation means as recommended correction data;
Form processing program characterized by functioning as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004362648A JP4081074B2 (en) | 2004-12-15 | 2004-12-15 | Form processing apparatus, form processing method, and form processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004362648A JP4081074B2 (en) | 2004-12-15 | 2004-12-15 | Form processing apparatus, form processing method, and form processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006172070A true JP2006172070A (en) | 2006-06-29 |
JP4081074B2 JP4081074B2 (en) | 2008-04-23 |
Family
ID=36672766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004362648A Active JP4081074B2 (en) | 2004-12-15 | 2004-12-15 | Form processing apparatus, form processing method, and form processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4081074B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000048215A (en) * | 1998-07-27 | 2000-02-18 | Sharp Corp | Data processor and medium recording control program for the same |
JP2000090193A (en) * | 1998-09-16 | 2000-03-31 | Sharp Corp | Character recognition device and item classifying method |
-
2004
- 2004-12-15 JP JP2004362648A patent/JP4081074B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000048215A (en) * | 1998-07-27 | 2000-02-18 | Sharp Corp | Data processor and medium recording control program for the same |
JP2000090193A (en) * | 1998-09-16 | 2000-03-31 | Sharp Corp | Character recognition device and item classifying method |
Also Published As
Publication number | Publication date |
---|---|
JP4081074B2 (en) | 2008-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4742404B2 (en) | Image recognition apparatus, image forming apparatus, image recognition method, and computer-readable recording medium storing image recognition program | |
KR100570224B1 (en) | Form definition data creation method and form handling machines | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JPH1011531A (en) | Slip reader | |
JP2001243423A (en) | Device and method for detecting character recording area of document, storage medium, and document format generating device | |
JP2003018393A (en) | Image processing system | |
JP4983464B2 (en) | Form image processing apparatus and form image processing program | |
JP2008282094A (en) | Character recognition processing apparatus | |
JP4081074B2 (en) | Form processing apparatus, form processing method, and form processing program | |
JP2008257543A (en) | Image processing system and program | |
JP2001052110A (en) | Document processing method, recording medium recording document processing program and document processor | |
JP2003223610A (en) | Character recognizing device and character recognizing method | |
JP4517822B2 (en) | Image processing apparatus and program | |
JP2010102734A (en) | Image processor and program | |
JP3930466B2 (en) | Character recognition device, character recognition program | |
JP6960646B1 (en) | Reading system, reading program and reading method | |
JP6994727B1 (en) | Reading system, reading program and reading method | |
JP2013182459A (en) | Information processing apparatus, information processing method, and program | |
JPS61272882A (en) | Information recognizing device | |
JP7183623B2 (en) | Image processing device, image processing method and image processing program | |
JP2829186B2 (en) | Optical character reader | |
JP6743401B2 (en) | Form design/read setting support device, form design/read setting support method, and optical character recognition system | |
JP2004341631A (en) | Microfilm ocr system | |
JP2006106903A (en) | Image processor | |
JPH01292586A (en) | Back-up device for recognition of character |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4081074 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120215 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130215 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140215 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |