JP4881722B2 - Form identification device and form identification program - Google Patents
Form identification device and form identification program Download PDFInfo
- Publication number
- JP4881722B2 JP4881722B2 JP2006354585A JP2006354585A JP4881722B2 JP 4881722 B2 JP4881722 B2 JP 4881722B2 JP 2006354585 A JP2006354585 A JP 2006354585A JP 2006354585 A JP2006354585 A JP 2006354585A JP 4881722 B2 JP4881722 B2 JP 4881722B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- form image
- sample
- input
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 17
- 238000013507 mapping Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 230000009466 transformation Effects 0.000 description 6
- 230000008602 contraction Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Description
本発明は、帳票識別処理において識別した帳票の種類を視覚的に表示する帳票識別技術に関する。 The present invention relates to a form identification technique for visually displaying the type of form identified in a form identification process.
一般に、帳票の自動識別を行う場合、帳票内の特徴量を用いて帳票の種類を識別することを行う。例えば、帳票内に記載されている文字コード、文字行、罫線、枠等を抽出し、それら特徴量と、事前にサンプルとして登録した帳票の特徴量とを照合して、帳票の種類を識別する。例えば、特許文献1に開示された技術は、帳票の特徴データを帳票毎に辞書として登録しておき、識別対象となる帳票画像が入力された場合、入力画像より罫線2値画像を作成し、予め登録しておいた辞書とでマッチングを実施する方法である。辞書には、罫線から得られる黒画素の位置などが、二次元座標の集合として登録される。また、特許文献2に開示された技術では識別対象となる入力帳票の特徴に点座標を付与した点(以下、入力点)と、辞書作成のために予め登録をした登録帳票の特徴に点座標を付与した点(以下、辞書点)とを設けて、前記入力点と辞書点の距離を算出し、前記距離がある距離基準内であれば入力点に対応付けられた辞書点が存在すると判定し、対応付けられた点数、入力点数及び辞書点数を基に照合の一致の程度を求める方法である。この手法では、入力点または辞書点として、罫線の端点や交点、並びに上下左右を罫線で囲まれる最小の領域(セル)の中心座標などを特徴点として用いる。
このように識別対象となる帳票に対して様々な識別手法が存在する。ここで問題となるのが帳票識別の結果を表示装置に提示する方法である。帳票種類の名称を表示することが一般的であるが、扱う帳票が多種に渡る場合、名称だけで当該識別結果が正しいかどうかを判断することは難しい。
In general, when performing automatic identification of a form, the type of form is identified using the feature amount in the form. For example, character codes, character lines, ruled lines, frames, etc. described in the form are extracted, and the feature type is compared with the feature quantity of the form registered in advance as a sample to identify the type of form . For example, the technique disclosed in
As described above, there are various identification methods for the forms to be identified. The problem here is how to present the result of form identification on the display device. It is common to display the name of the form type. However, when there are various forms to be handled, it is difficult to determine whether the identification result is correct only by the name.
従来の帳票識別処理においては、識別の結果として得た帳票種類の名称を提示するだけで、その識別結果が正しいかどうかを区別することが困難となる課題があった。 In the conventional form identification processing, there is a problem that it is difficult to distinguish whether the identification result is correct only by presenting the name of the form type obtained as a result of identification.
本発明は、多種類の帳票を取り扱う場合に、帳票識別結果を視覚的に提示すると共に、視覚的表示の際に、帳票画像にずれが存在する場合や類似した帳票が混在するような場合でも、差異ある個所を強調して表示する帳票識別装置、及びそのプログラムを提供することを目的とする。更に、本発明は、辞書に登録された見本帳票画像あるいは入力帳票画像に記載された個人情報等を保護した表示が可能な帳票識別装置を提供することを目的とする。 The present invention visually presents a form identification result when handling various types of forms, and even when there are deviations in the form image or when similar forms are mixed in the visual display. It is an object of the present invention to provide a form identification device that highlights and displays differences and a program thereof. It is another object of the present invention to provide a form identification device that can display a sample form image registered in a dictionary or protect personal information described in an input form image.
本発明は、上記目的を達成するため、画像撮像部と処理部と記憶部と表示部とを備え、画像撮像部は帳票を撮像することによって、当該帳票の画像データを取得し、処理部は、記憶部に蓄えられた辞書を元に帳票画像の種類を識別し、当該帳票識別の結果を表示する表示データを表示部に提示する帳票識別装置とそのプログラムを、帳票識別結果を表示する際に、入力帳票画像と、帳票識別処理の結果によって得られた最も一致した特徴を持つ帳票種類の見本帳票画像を重ね合わせて提示する構成とする。 In order to achieve the above object, the present invention includes an image capturing unit, a processing unit, a storage unit, and a display unit. The image capturing unit captures a form to acquire image data of the form, and the processing unit When identifying the form image type based on the dictionary stored in the storage unit and displaying the form identification result and the program for displaying the form identification result on the display unit and displaying the form identification result on the display unit In addition, the input form image and the sample form image of the form type having the most matched characteristic obtained by the result of the form identification process are displayed in a superimposed manner.
また、入力帳票画像と見本帳票画像間でずれがあることを検知し、ずれが存在すると判断した場合は、帳票特徴点マッピングを用いてずれを吸収して表示する帳票識別装置とそのプログラムを提供する。 In addition, a form identification device and a program for detecting and detecting a shift between the input form image and the sample form image and absorbing the shift using the form feature point mapping are provided. To do.
更に、本発明においては、差異のある個所を強調表示する、あるいは個人情報が記載されうる箇所にマスクを掛けて表示する等の処理を行う帳票識別装置とそのプログラムを提供する。 Furthermore, the present invention provides a form identification apparatus and program for performing processing such as highlighting a portion having a difference or displaying a portion where personal information can be written with a mask.
本発明により、識別した帳票の種類に応じて、帳票識別結果の表示を入力画像と見本画像を重ね合わせて行うことができる。更に、帳票画像間でずれが存在する場合にも、帳票特徴点マッピングを用いて、位置ずれを吸収して表示し、更に差異のある個所を強調表示する等の表示処理が可能となるため、帳票の振分け処理の効率化が見込める。 According to the present invention, the form identification result can be displayed by superimposing the input image and the sample image in accordance with the identified form type. Furthermore, even when there is a deviation between the form images, it is possible to perform display processing such as absorbing and displaying the position deviation by using the form feature point mapping, and further highlighting the difference. The efficiency of form distribution processing can be expected.
以下、本発明の実施の形態を図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
初めに、本実施例の前提とするハードウェア構成について述べる。図1は、帳票読取装置の一実施例を示すハードウェア構成図である。高速帳票読取装置では、画像撮像部である画像撮像装置0101により紙文書を電子データに変換し、それを記憶部である外部記憶装置0105及びメモリ0106に蓄えて、中央処理部(CPU)である中央演算装置0107により読取を行う。本実施例に係わる帳票識別・表示プログラムは、外部記憶装置0105またはメモリ0106に蓄えられているか、場合によっては、通信装置0109を介して帳票読取装置に導入されこれら記憶部に記憶される。
First, the hardware configuration assumed in this embodiment will be described. FIG. 1 is a hardware configuration diagram illustrating an embodiment of a form reading apparatus. In the high-speed form reading device, a paper document is converted into electronic data by an
この帳票識別・表示プログラムは、撮像された電子データ画像に対して、中央演算装置0107が帳票識別処理や、識別結果の表示制御を行う。帳票の種類を特定する場合は、記憶部である外部記憶装置0105またはメモリ0106に蓄えられた帳票辞書を参照し、帳票種類を判別する。これらの処理は、操作端末装置0102を通して操作者である人間が操作可能であり、処理結果は表示端末装置0103を通して表示される。処理結果などの情報は、必要に応じて外部記憶装置0105に蓄積または通信装置0109を通して外部装置にデータとして送信される。上記装置群は内部バス0108によって繋がっている。帳票識別結果を反映して、入力された伝票類はソータ装置0104によって、定義された箱に分配・集積される。言い換えるなら、画像撮像装置0101とソータ装置0104を除けば、通常のパーソナルコンピュータ(PC)などのコンピュータシステムで構成されうる。なお通常のPCにおいては、表示制御用のチップをCPUとは別に有している場合もあるが、本実施例においても、グラフィックボードを別構成とし、表示制御を分担しても良いことは言うまでもなく、どちらの構成であっても、帳票識別と表示用のプログラムを実行する構成を処理部と呼ぶことがある。
In this form identification / display program, the
さて、図2は、上述した帳票読取装置における帳票読取処理、すなわち帳票識別から振分けに至る処理の機能ブロック図を表す。初めに、画像撮像装置0101からなる画像撮像部0201で、入力の紙伝票が撮像され、電子(データ)画像となる。この電子画像は通常は外部記憶装置0105やメモリ0106などの記憶部に一旦記憶され、以降の帳票識別処理は、この撮像された電子画像を元に行う。続いて、帳票識別部0202において帳票識別を行う。帳票識別を行う場合は、帳票を識別するための特徴を辞書に蓄えた帳票識別特徴辞書0205を用いる。識別された帳票種類は、識別結果表示部0203によって表示端末装置0103上に視覚的に表示されるよう制御される。この表示制御によって表示される画像としては、見本帳票画像辞書0206に蓄えられた画像、または帳票識別特徴辞書0205から計算された画像が使われる。最後に、確定した帳票識別結果に従って、帳票振分辞書0207に定義された振分定義に応じて、ソータ装置0104からなるソータ部0204の該当スタックに識別対象であった帳票が搬送される。
FIG. 2 is a functional block diagram of the form reading process in the form reading apparatus described above, that is, the process from form identification to distribution. First, an input paper slip is picked up by an
ここで、帳票識別部0202と識別結果表示部0203は,処理部である中央演算装置0107などが実行するプログラムによるソフトエア処理によって構成されることは、上述の通りである。次に、まず帳票識別処理部0202と帳票識別特徴辞書0205についてその概略を述べる。
Here, the
図3は、処理部である中央演算装置0107で実行される本実施例の帳票識別部0202における帳票の識別過程を示すフロー図である。判別対象となる入力帳票画像の電子画像は当該過程を経て識別が行われる。先ず、判別対象となる帳票の電子画像は、画像入力部である画像撮像装置0101より取得されており、これを直接、或いは記憶部に一旦記憶してから入力画像とする(0301)。次に、この入力画像より特徴量の抽出範囲を設定するために、帳票用紙の四隅を検出する紙領域基準抽出を行う(0302)。検出した帳票用紙の四隅の座標より用紙サイズの算出を行い、判別対象となる帳票の用紙サイズを判定する(0303)。入力画像より上述の過程で決定した用紙サイズ内より入力画像の特徴量を抽出し、帳票の学習サンプル画像より作成した帳票識別特徴辞書0205を用いて特徴量の一次照合を行う(0304)。
FIG. 3 is a flowchart showing a form identifying process in the
ここでの特徴量とは、判別対象となる帳票から抽出した入力画像において、上述した辞書作成の際の特徴量同様に、例えば、画像の輝度が顕著に表れる箇所のことを指し、入力画像から格子状に特徴点を抽出して使用する。そして、入力画像より抽出した特徴量と、サンプル画像より作成した辞書とを比較し、 両者の特徴量の距離計算値がある距離基準値内である場合、入力画像とサンプル画像とが一致、符合する(YES)と判定し、処理を終了する(0305)。距離計算手法としては,ユークリッド距離や、動的記入マスク距離を用いる。入力帳票が回転しているケースに対応する場合は、帳票を180度または90度ずつ回転させた上で特徴量を生成し、これとの距離計算を行う。この特徴量と、辞書との距離計算値が上記の距離基準値を上まわっている場合、入力画像より帳票用紙内に記載されている領域(記載領域という)を検出する記載領域基準抽出を行う(0306)。検出した記載領域の範囲内より入力画像の特徴量を新たに抽出し、特徴量の二次照合を行い、入力画像とサンプル画像とが一致するか否かを判定して(0307)、帳票識別過程を終了する。 The feature amount here refers to a portion where the luminance of the image appears remarkably in the input image extracted from the form to be discriminated, for example, as in the case of the dictionary creation described above. Feature points are extracted and used in a grid pattern. Then, the feature quantity extracted from the input image is compared with the dictionary created from the sample image. If the distance calculation value of both feature quantities is within a certain distance reference value, the input image and the sample image match and match. Yes (YES), and the process ends (0305). As the distance calculation method, Euclidean distance or dynamic entry mask distance is used. When the case corresponds to the case where the input form is rotating, the form is rotated 180 degrees or 90 degrees at a time, and the feature amount is generated, and the distance is calculated. When the calculated distance between the feature amount and the dictionary exceeds the distance reference value, a description area reference extraction for detecting an area (referred to as a description area) described in the form sheet from the input image is performed. (0306). The feature quantity of the input image is newly extracted from the range of the detected description area, the feature quantity is secondarily collated, and it is determined whether or not the input image and the sample image match (0307), and the form is identified. End the process.
図4は、本実施例における、帳票識別結果を表示端末装置0103に提示する表示処理の過程を示すフロー図である。処理部である中央演算装置0107で実行される識別結果表示部0203のフローにおいて、入力される情報としては、入力帳票画像と、帳票識別結果がある(0401)。入力帳票画像は先の電子画像である。帳票識別結果には、認識した帳票種類、その識別尤度、回転方向、ずれ度合いが最低含まれるとする。まず、帳票識別結果に含まれるずれ度合いが閾値を超えるか、または、識別尤度が閾値を超えるかした場合(0402)、入力帳票画像と見本帳票画像の間でずれがあると判断し、これらの画像を適切に重ね合わせるための計算を行う。まず入力帳票画像、及び見本帳票画像から特徴点を抽出する(0403)。次に特徴点の照合を行い(0404)、入力帳票画像と見本帳票画像を最適に重ね合わせるためのパラメータ計算(ずれ量、回転量、伸縮量の計算)を行う。
FIG. 4 is a flowchart showing the process of display processing for presenting the form identification result to the
以上の結果を元に、重ね合わせ表示に用いる見本帳票画像の作成を行う(0405)。例えば回転があれば、見本帳票画像に対して回転を掛けた場合の画像を計算する。最初にずれがないと判断された場合は、上記の特徴点計算の過程を省くことができる。この特徴点間の対応を取り、両画像間の最適に近似する線形変換パラメータを求めるアルゴリズムを、特徴点マッピングと総称する。ずれ計算の過程であるステップ0403から0404の計算処理については、後で説明を行う。次に、見本画像計算(0405)が終わった後に、入力帳票画像と見本帳票画像を、どのように表示するかの表示画像計算を行う(0406)。そして、計算された画像を表示端末装置0103のディスプレイ上に表示し(0407)、識別結果表示部0203の処理を終える。
Based on the above result, a sample form image used for overlay display is created (0405). For example, if there is rotation, an image when the sample form image is rotated is calculated. If it is first determined that there is no deviation, the above feature point calculation process can be omitted. Algorithms that take correspondence between feature points and obtain a linear transformation parameter that optimally approximates both images are collectively referred to as feature point mapping. The calculation processing of
図5は上記のフローにおいてステップ403で抽出、計算した特徴点の具体例を示す図である。特徴点としては、例えば、帳票の黒罫線を抽出し、上下左右の4組の黒罫線から構成される枠の中心点を特徴点とする、あるいはハリス(Harris)特徴のように画像の局所的な濃度変動方向を計算し、その極大値を特徴点とする方法などがある。本図で示した方法は輪郭の解析の例である。ここでは2値画像が入力されたとして(図5上段)、そこから連結成分の輪郭を抽出して、これを直線分で近似し(図5中段)、その直線分の端点(×印)を特徴点としたものである(図5下段)。先に説明した特徴点抽出0403、特徴点照合0404において、例えば、図5に示すような特徴点抽出を入力帳票画像と、見本帳票画像に対して行い、次に特徴点間の対応を取ることで、2つの画像にどれほどのずれや回転が存在するのかを性格に計算することができる。
FIG. 5 is a diagram showing a specific example of the feature points extracted and calculated in step 403 in the above flow. As the feature points, for example, a black ruled line of a form is extracted, and the center point of a frame composed of four sets of upper, lower, left, and right black ruled lines is used as a feature point, or a local feature of an image such as a Harris feature is used. There is a method of calculating a concentration variation direction and using the maximum value as a feature point. The method shown in this figure is an example of contour analysis. Here, assuming that a binary image has been input (upper part of FIG. 5), the outline of the connected component is extracted therefrom and approximated by a straight line (middle part of FIG. 5). This is a feature point (lower part of FIG. 5). In the
正しい特徴点と誤った特徴点群が混ざり合った中から、正しいデータのみを取り出す代表的な手法にRANSAC(Random Sample Consensus)がある。これは、全データから必要最低限の個数のデータをランダムに選択し、それから拘束条件のパラメータ(線形変換)を計算する。そして、残りのデータからその値の妥当性を評価し、これを十分多数回行って最大の評価を得た値とそれを支持したデータを取り出す。これによって正しいパラメータと正しいデータの両方が同時に推定できる。RANSACアルゴリズムの計算では3点必要だが、線形変換の種類として、回転、シフト、伸縮(かつ、XYで等倍)というものを考えるならば、実は2点の対応関係を選ぶだけで足りる。この性質を利用することで帳票識別の計算量の削減を図ることができる。これを帳票特徴点マッピングと称する。 RANSAC (Random Sample Consensus) is a typical method for extracting only correct data from a mixture of correct feature points and incorrect feature points. In this case, a necessary minimum number of data are randomly selected from all data, and then a constraint condition parameter (linear transformation) is calculated. Then, the validity of the value is evaluated from the remaining data, and this is performed a sufficient number of times to obtain the value obtained with the maximum evaluation and the data supporting it. This allows both correct parameters and correct data to be estimated simultaneously. In the calculation of the RANSAC algorithm, three points are required. However, when considering the types of linear transformation such as rotation, shift, and expansion / contraction (and XY equal magnification), it is actually sufficient to select the correspondence between two points. By utilizing this property, it is possible to reduce the amount of calculation for form identification. This is called form feature point mapping.
つまり、図6に示すように、点{x1、x2}が見本帳票から得られた特徴点、点{p1、p2}が入力帳票から得られた特徴点であるとして、点x1を基準点として、点x2の座標を伸縮、回転して、ベクトルx2−x1がベクトルp2−p1と一致するようにした上で、点x1を点p1へと移動する作業を行うという変換を意味する。計算量を削減した帳票特徴点マッピングの擬似プログラムコードを図7に示す。擬似コード中の線形変換は、次の式で表される。すなわち、まず、線形変換を That is, as shown in FIG. 6, assuming that the point {x1, x2} is a feature point obtained from the sample form and the point {p1, p2} is a feature point obtained from the input form, the point x1 is used as a reference point. , The coordinate of the point x2 is expanded / contracted and rotated so that the vector x2-x1 coincides with the vector p2-p1, and then the operation of moving the point x1 to the point p1 is performed. FIG. 7 shows a pseudo program code for form feature point mapping with a reduced amount of calculation. The linear transformation in the pseudo code is expressed by the following formula. That is, first, the linear transformation
とモデル化する。このとき、 And model. At this time,
と置くならば、伸縮、回転、移動の各変換量は次のように求まる。すなわち、伸縮量は、 Then, the conversion amounts of expansion / contraction, rotation, and movement can be obtained as follows. That is, the amount of expansion and contraction is
と表される。回転量は、 It is expressed. The amount of rotation is
と表される。また、移動量は、 It is expressed. The amount of movement is
と導かれる。 It is guided.
図8は第一の実施例により、入力帳票画像と見本帳票画像を重ね合わせた表示の具体例である。ここでは、帳票識別特徴辞書0205に含まれるメッシュの粗い画像(粗画像と呼ぶ)を辞書として、2つを重ね合わせている。この場合、図2に示した見本画像辞書0206は不要となり、辞書容量が削減できる。粗画像表示の利点は、帳票識別を運用する現場において入力帳票等に記入された個人情報の流出を避け得ること、また、画像処理の計算量を削減することなどである。
FIG. 8 is a specific example of the display in which the input form image and the sample form image are superimposed according to the first embodiment. Here, a coarse mesh image (referred to as a coarse image) included in the form
続いて、図9は表示処理の他の実施例として、入力帳票画像と見本帳票画像を重ね合わせ、更に差異のある差異箇所を色表示やグレー表示90によって強調した表示例である。
Next, FIG. 9 shows a display example in which the input form image and the sample form image are overlaid as another embodiment of the display process, and further, the different differences are highlighted by color display or
差異箇所の計算は次のようにして行う。差異箇所の計算段階では、入力帳票画像の帳票種を識別する処理と、当該帳票種を代表する見本帳票画像との帳票特徴点マッピングが済んでいるとする。ここで、帳票種の識別は、図3に示す0302から0307の処理によって行われる。また、帳票特徴点マッピングは、図4に示す0402から0404の処理によって行われる。
The difference is calculated as follows. It is assumed that the process of identifying the form type of the input form image and the form feature point mapping between the sample form image representing the form type have been completed at the difference portion calculation stage. Here, the form type is identified by the
上述した帳票特徴点マッピングにより、両画像間を重ね合わせる際に行うべき、回転、シフト、伸縮量が判明する。そこで入力帳票画像に対して当該パラメータを用いた変換を行い、二次元格子状配置された特徴点を用いて特徴ベクトルを計算する。線形変換を行った入力帳票画像から得られたベクトルをI、見本帳票画像から得られたベクトルをMとする。各ベクトルは二次元格子状の特徴点を用いて抽出しているため、これらのベクトルを、帳票を荒く近似した画像と見なすことができる。そこで、入力帳票画像に対応するベクトルをI(x,y)、見本帳票画像に対応するベクトルをM(x,y)で表す。このとき、2つの画像間の違いを表す差異指標D(x,y)は、 By the above-described form feature point mapping, the amount of rotation, shift, and expansion / contraction to be performed when the two images are overlaid is determined. Therefore, the input form image is converted using the parameter, and the feature vector is calculated using the feature points arranged in a two-dimensional grid. Let I be a vector obtained from the input form image subjected to linear transformation, and M be a vector obtained from the sample form image. Since each vector is extracted using two-dimensional grid-like feature points, these vectors can be regarded as an image that roughly approximates a form. Therefore, a vector corresponding to the input form image is represented by I (x, y), and a vector corresponding to the sample form image is represented by M (x, y). At this time, the difference index D (x, y) representing the difference between the two images is
で計算できる。すなわちD(x,y)の大きい箇所は、両帳票画像間で何らかの差異が存在する所である。ただし、この差異指標D値をそのまま用いると局所的な変動に影響され易いという問題があるため、安定した差異を表す尺度として差異尤度L(x,y)を用いる。差異尤度Lは、差異指標の部分領域における平均値であり、次式に従って計算する。 It can be calculated with That is, the part where D (x, y) is large is a place where there is some difference between the two form images. However, if this difference index D value is used as it is, there is a problem that it is easily affected by local fluctuations, and therefore, the difference likelihood L (x, y) is used as a scale representing a stable difference. The difference likelihood L is an average value in the partial area of the difference index, and is calculated according to the following equation.
この式中のRx、Ryは部分平均化のサイズを表す。次に、差異尤度の高い方から順に、指定されたN個の点(x1,y1)・・・(xN,yN)を選択する。これらの点に相当する箇所が、画像上の差異箇所と判断され、当該箇所に色を強調して表示することとなる。 Rx and Ry in this formula represent the size of partial averaging. Next, the designated N points (x1, y1)... (XN, yN) are selected in order from the highest difference likelihood. A part corresponding to these points is determined as a difference part on the image, and the color is emphasized and displayed at the part.
差異強調表示の利点は、類似した帳票群がある場合において、帳票識別の結果を成否を判断をサポートし、迅速な処理を実現し得ることである。なお、これらの差異箇所の計算は、先に説明したCPUなどで構成される中央演算装置0107におけるプログラム処理で実現できることは言うまでもない。また、画像表示の際、画面上の特定されたエリアである差異箇所90を、色表示、グレー表示によって強調表示する技術も、中央演算装置0107などで実行される表示制御プログラムで実現可能である。
The advantage of the difference highlighting is that, in the case where there are similar form groups, it is possible to support the judgment of success or failure of the result of form identification and to realize quick processing. Needless to say, the calculation of these differences can be realized by the program processing in the
次に、図10は表示処理の他の実施例として、帳票画像上に書かれた特定情報(記載内容)の部分(特定エリアと呼ぶ)にマスク100を掛けて表示する表示例である。マスクの掛け方としては2通りある。1つは、見本帳票画像が未記入の帳票画像として、見本帳票画像と異なる部分で、かつ黒画素が閾値以上の所を記載エリアと判断し、この記載エリアをマスクして表示する方法である。もう一つは、見本帳票画像が記入帳票である場合で、連結成分のサイズや輪郭成分の周波数解析などにより、手書き記入と見なされたエリア(記入エリア)にマスクを掛けて表示する方法である。マスク表示の利点は、帳票識別の運用現場において、入力帳票等に記入された個人情報の流出を避け得ることである。
Next, FIG. 10 shows a display example in which a specific information (description content) written on a form image (referred to as a specific area) is displayed with a
なお、記入帳票上に書かれている文字が手書き文字か、あるいは元々帳票に印刷されているような活字文字であるかを見分ける手段としては、本件出願人が先に出願した特開2003−308483公報「文字種判定プログラム、文字識別プログラム及び文字識別装置」にて開示した方法を用いることができる。これらのマスク表示のための特定エリア検出は、先に説明したCPUなどで構成される中央演算装置0107におけるプログラム処理で実現できることは言うまでもない。また、画像表示の際、画面上の特定エリアをマスク表示する技術も、中央演算装置0107などで実行される表示制御プログラムで実現可能である。
Incidentally, as means for discriminating whether the character written on the entry form is a handwritten character or a type character originally printed on the form, Japanese Patent Application Laid-Open No. 2003-308483 filed earlier by the present applicant. The method disclosed in the publication “Character Type Determination Program, Character Identification Program, and Character Identification Device” can be used. It goes without saying that the specific area detection for mask display can be realized by the program processing in the
さらに、上述した表示手法は、単独で行われるのみでなく、組み合わせての運用も可能である。例えば、ぼかし表示と差異強調表示を組み合わせる、マスク表示と差異強調表示を組み合わせるなどである。 Furthermore, the display methods described above are not only performed independently, but also can be used in combination. For example, a combination of blur display and difference emphasis display is combined, and mask display and difference emphasis display are combined.
また、図11は表示処理の他の実施例として、最も単純な場合である、入力帳票と見本帳票画像をそのまま重ね合わせて表示する表示例である。 FIG. 11 shows a display example in which the input form and the sample form image are superimposed and displayed as they are in the simplest case as another embodiment of the display process.
図12は、上述した表示手法を用いた場合の、帳票識別結果をユーザに示す場合の画面構成の一例である。1201には識別対象となった未知帳票の番号が表示されており、1202に帳票識別の結果として候補に挙げられた帳票種の名前が並んでいる。また、帳票種の名前を並べると同時に、その縮小画像を並べて表示することも可能である。1203には、そのなかのどれを画像上で重ね合わせて表示するか、を選択するためのボタンが並んでいる。この場合、第一候補である帳票Dがユーザによって選択されているので、帳票Dの見本帳票画像と、入力帳票画像とが重ね合わさり、1204に表示される。この表示形態により、ユーザは帳票画像を見比べながら、正しい帳票種を選択することが可能となる。また、識別候補の中に正しい帳票種が見つからない場合は、ユーザが帳票種名を入力できるように、1205に入力ボックスがある。選択された帳票種が正しいとユーザが判断した場合は、1206にある決定ボタンを押して、帳票の識別結果を確定する。これら表示画面に関する処理もまた、中央演算装置0107で実行される。
FIG. 12 is an example of a screen configuration when the form identification result is shown to the user when the above-described display method is used. 1201 displays the number of the unknown form as an identification target, and 1202 lists the names of the form types listed as candidates as a result of the form identification. It is also possible to display the reduced images side by side at the same time the form types are arranged. In 1203, buttons for selecting which of them to be displayed on the image are arranged. In this case, since the form D which is the first candidate is selected by the user, the sample form image of the form D and the input form image are superimposed and displayed on 1204. With this display form, the user can select the correct form type while comparing the form images. If a correct form type is not found among the identification candidates, an
0101…画像撮像装置、0102…操作端末装置、0103…表示端末装置、0104…ソータ装置、0105…外部記憶装置、0106…メモリ、0107…中央演算装置、0108…内部バス、0109…通信装置、0201…画像撮像部、0202…帳票識別部、0203…識別結果表示部、0204…ソータ部、0205…帳票識別特徴辞書、0206…見本帳票画像辞書、0207…帳票振分辞書、0301…帳票画像入力部、0302…紙領域基準抽出部、0303…サイズ判定部、0304…一次照合部、0305…閾値判定部、0306…記載領域基準抽出部、0307…二次照合部、0401…入力データ、0402…ズレ判定部、0403…特徴点抽出部、0404…特徴点照合部、0405…見本画像計算部、0406…表示画像計算部、0407…画像表示部。
DESCRIPTION OF
Claims (6)
前記帳票を読み取って入力帳票画像を取得する画像撮像部と、複数の見本帳票画像の特徴量を記述した帳票識別特徴辞書を記憶する記憶部と、前記入力帳票画像を処理する処理部と、表示部とを有し、
前記処理部は、
前記記憶部に蓄積された前記辞書を基に、前記入力帳票画像の種類を識別し、
当該帳票識別の結果を前記表示部に表示する際に、前記入力帳票画像と、当該帳票識別の結果、最も一致した特徴量を有する前記見本帳票画像とを、前記入力帳票画像と前記見本帳票画像の、ずれ度合いが予め定められた閾値を超えている場合、前記入力帳票画像と前記見本帳票画像の特徴点抽出を行い、抽出された前記特徴点の照合結果に基づき、前記入力帳票画像と前記見本帳票画像を重ね合わせるための変換パラメータを算出し、前記変換パラメータにより前記見本帳票画像を変換した後、重ね合わせて表示するよう制御する
帳票識別装置。 A form identification device that reads and identifies forms,
An image capturing unit that reads the form to acquire an input form image, a storage unit that stores a form identification feature dictionary describing feature amounts of a plurality of sample form images, a processing unit that processes the input form image, and a display And
The processor is
Based on the dictionary stored in the storage unit, identify the type of the input form image,
When displaying the result of the form identification on the display unit, the input form image, the sample form image having the most consistent feature amount as a result of the form identification , the input form image and the sample form image When the degree of deviation exceeds a predetermined threshold, the feature point extraction of the input form image and the sample form image is performed, and the input form image and the A form identification device that calculates conversion parameters for superimposing sample form images, converts the sample form images according to the conversion parameters, and controls the display so as to display them superimposed.
前記処理部は、
前記入力帳票画像と前記見本帳票画像を重ね合わせて表示する際、粗い画像を重ね合わせて表示するよう制御する
帳票識別装置。 The form identification device according to claim 1,
The processor is
A form identifying apparatus that controls to display a coarse image in a superimposed manner when the input form image and the sample form image are displayed in a superimposed manner.
前記処理部は、
前記入力帳票画像と前記見本帳票画像を重ね合わせて表示する際、当該両画像の差異箇所を強調して表示するよう制御する
帳票識別装置。 The form identification device according to claim 1,
The processor is
A form identification device that controls to display a difference portion between the input form image and the sample form image in an emphasized manner when displaying the input form image and the sample form image.
前記処理部は、
前記入力帳票画像と前記見本帳票画像を重ね合わせて表示する際、前記入力帳票画像の特定エリアにマスクを施して表示するよう制御する
帳票識別装置。 The form identification device according to claim 1,
The processor is
A form identification device that controls to display a specific area of the input form image with a mask when the input form image and the sample form image are displayed in a superimposed manner.
前記処理部を、
前記入力帳票画像と、前記複数の見本帳票画像のいずれと符合するかを識別する識別ステップと、
前記識別ステップによって得られた識別結果を表示する際、前記入力帳票画像と、最も一致した特徴量を有する前記見本帳票画像を、前記入力帳票画像と前記見本帳票画像の、ずれ度合いが予め定められた閾値を超えている場合、前記入力帳票画像と前記見本帳票画像の特徴点抽出を行い、抽出された前記特徴点の照合結果に基づき、前記入力帳票画像と前記見本帳票画像を重ね合わせるための変換パラメータを算出し、前記変換パラメータにより前記見本帳票画像を変換した後、重ね合わせて表示するよう制御する表示制御ステップとを実行するよう制御する
帳票識別プログラム。 A form identification program for use in a form identification apparatus including a storage unit for storing a form identification feature dictionary describing feature quantities of a plurality of sample form images, and a processing unit for processing an input form image obtained by reading an input form,
The processing unit is
An identification step for identifying the input form image and which of the plurality of sample form images matches;
When displaying the identification result obtained by the identification step , the degree of deviation between the input form image and the sample form image is determined in advance for the sample form image having the feature quantity that most closely matches the input form image. If the threshold value exceeds the threshold value, the feature points of the input form image and the sample form image are extracted, and the input form image and the sample form image are superimposed based on the extracted matching result of the feature points. A form identification program for controlling to execute a display control step for controlling to display a superimposed parameter after calculating a conversion parameter and converting the sample form image with the conversion parameter .
前記処理部を、前記表示制御ステップで、
前記入力帳票画像と前記見本帳票画像を重ね合わせる際に、粗い画像を重ねて表示する、差異箇所を強調して表示する、または特定エリアにマスクを掛けて表示することのいずれか、またはこれらの組み合わせを実行するよう制御する
帳票識別プログラム。 The form identification program according to claim 5,
In the display control step, the processing unit is
When the input form image and the sample form image are overlaid, either a rough image is overlaid, a difference portion is highlighted, or a specific area is masked or displayed. A form identification program that controls to execute combinations.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006354585A JP4881722B2 (en) | 2006-12-28 | 2006-12-28 | Form identification device and form identification program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006354585A JP4881722B2 (en) | 2006-12-28 | 2006-12-28 | Form identification device and form identification program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008165506A JP2008165506A (en) | 2008-07-17 |
JP4881722B2 true JP4881722B2 (en) | 2012-02-22 |
Family
ID=39694917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006354585A Active JP4881722B2 (en) | 2006-12-28 | 2006-12-28 | Form identification device and form identification program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4881722B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639071B (en) * | 2019-03-01 | 2023-07-28 | 贵州白山云科技股份有限公司 | Form display method and device |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3215176B2 (en) * | 1992-09-07 | 2001-10-02 | 株式会社東芝 | Document image processing apparatus and document image processing method |
JP3276555B2 (en) * | 1996-03-21 | 2002-04-22 | 沖電気工業株式会社 | Format recognition device and character reader |
JP2001155168A (en) * | 1999-11-30 | 2001-06-08 | Toshiba Corp | Device and method for collating image |
JP4269059B2 (en) * | 2003-05-30 | 2009-05-27 | 株式会社Pfu | Form processing program, method and apparatus |
JP4192159B2 (en) * | 2005-03-29 | 2008-12-03 | 株式会社東芝 | Information recognition system |
-
2006
- 2006-12-28 JP JP2006354585A patent/JP4881722B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008165506A (en) | 2008-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4616120B2 (en) | Image processing apparatus and inspection apparatus | |
JP4824987B2 (en) | Pattern matching apparatus and semiconductor inspection system using the same | |
JP6557943B2 (en) | Image collation device, image sensor, processing system, and image collation method | |
JP5447235B2 (en) | Marker processing method, marker processing apparatus, and marker processing program | |
US9390310B2 (en) | Striped pattern image examination support device, striped pattern image examination support method and program | |
US20080205769A1 (en) | Apparatus, method and program product for matching with a template | |
US20160012600A1 (en) | Image processing method, image processing apparatus, program, storage medium, production apparatus, and method of producing assembly | |
JP6903966B2 (en) | Information processing equipment, information processing systems and programs | |
JP2007025902A (en) | Image processor and image processing method | |
JP5100688B2 (en) | Object detection apparatus and program | |
JP2010071951A (en) | Visual inspection device and visual inspection method | |
WO2005096130A1 (en) | Method and device for detecting directed position of image pickup device and program for detecting directed position of image pickup device | |
US20050198600A1 (en) | Layout verifying device verifying an interconnection layout | |
JP4881722B2 (en) | Form identification device and form identification program | |
JP2006323779A (en) | Image processing method and device | |
JP5010627B2 (en) | Character recognition device and character recognition method | |
JP2009025856A (en) | Document discrimination program and document discrimination device | |
CN114926829A (en) | Certificate detection method and device, electronic equipment and storage medium | |
JP3487494B2 (en) | Menu selection method and device | |
JP2007140703A (en) | Method for reading insurance policy, system thereof, and insurance policy recognition system | |
JP5169648B2 (en) | Original image search device and original image search program | |
JP6055952B1 (en) | Image inspection apparatus, image inspection method, and program | |
JP4648084B2 (en) | Symbol recognition method and apparatus | |
JPWO2019167278A1 (en) | Store equipment, store systems, image acquisition methods, and programs | |
JP4050677B2 (en) | Image processing apparatus, image processing method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090717 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4881722 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |