JP2000322512A - Device and method for processing document - Google Patents

Device and method for processing document

Info

Publication number
JP2000322512A
JP2000322512A JP11133070A JP13307099A JP2000322512A JP 2000322512 A JP2000322512 A JP 2000322512A JP 11133070 A JP11133070 A JP 11133070A JP 13307099 A JP13307099 A JP 13307099A JP 2000322512 A JP2000322512 A JP 2000322512A
Authority
JP
Japan
Prior art keywords
area
information
template
position information
form image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11133070A
Other languages
Japanese (ja)
Inventor
Kitahiro Kaneda
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11133070A priority Critical patent/JP2000322512A/en
Publication of JP2000322512A publication Critical patent/JP2000322512A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To exactly and highly accurately perform document processing by individually calculating the quantity of deviation for each area and moving the relative positions of a document image and template information just by the maximum value. SOLUTION: With an extraction block as a reference, an area overlapped with a template block is defined as an examination object area and the extraction block, in which the examination object area is greater than a prescribed value, is left as the candidate of a processing object area (a). Concerning the extraction block existent over plural template blocks, among plural areas generated by overlapping, the maximum area is set as the examination object area (b). The deviation of a central coordinate between the selected extraction block and the template block paired with the extraction block is calculated concerning all pair blocks, all the template blocks are moved just by the calculated representative deviation quantity and an area to be overlapped after this movement is defined as the processing object area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票処理装置及び
帳票処理方法に関し、例えば入力された帳票画像と予め
記憶している比較対照のテンプレートの画像情報との位
置合わせを行う帳票処理装置及び帳票処理方法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form processing apparatus and a form processing method, for example, a form processing apparatus and a form for aligning an input form image with image information of a template to be compared and stored in advance. Regarding the processing method.

【0002】[0002]

【従来の技術】同じ種類の帳票を一括して大量に自動認
識可能な帳票処理装置の分野において、例えば、スキャ
ナ等によって読み取った帳票画像に対して文字認識処理
を施す場合には、予め記憶しているテンプレート情報、
即ち、比較対象であるテンプレート帳票の部分単位でど
のような文字認識処理を行うべきかを予め登録してある
情報を、入力された帳票画像に重ね合わせ、その帳票画
像に対して、テンプレート情報により指定されている文
字認識処理を施すのが一般的である。
2. Description of the Related Art In the field of a form processing apparatus capable of automatically recognizing a large number of forms of the same type in a lump, for example, when performing a character recognition process on a form image read by a scanner or the like, it is necessary to store the form image in advance. Template information,
That is, information preliminarily registered as to what kind of character recognition processing should be performed in partial units of the template form to be compared is superimposed on the input form image, and the form image is subjected to template information. In general, a specified character recognition process is performed.

【0003】このような帳票処理を行う場合には、帳票
画像とテンプレート情報との重ね合わせが正確に行われ
ることが必要であるが、スキャナ等の一般的な画像入力
装置においては、同じ帳票を読み取ったとしても、スキ
ャナの物理的精度に起因して、一枚ごとに読み取り位置
が微妙に異なるという問題がある。このため、テンプレ
ート情報を帳票画像に単に重ね合わせただけでは、帳票
処理装置の内部においてテンプレート帳票画像の位置
と、入力された帳票画像の位置との間にずれが生じてし
まうため、テンプレート情報に従って当該帳票画像に対
して文字認識処理を施しても、正確な認識結果が得られ
なくなってしまう。
In performing such a form processing, it is necessary that the form image and the template information are accurately superimposed. However, in a general image input apparatus such as a scanner, the same form is processed. Even if it is read, there is a problem that the reading position is slightly different for each sheet due to the physical accuracy of the scanner. For this reason, if the template information is simply superimposed on the form image, a deviation occurs between the position of the template form image and the position of the input form image inside the form processing apparatus. Even if character recognition processing is performed on the form image, an accurate recognition result cannot be obtained.

【0004】そこで、このような位置ずれの問題を未然
に防止すべく、従来の帳票処理装置においては、帳票の
読み取りに搬送精度の高いスキャナを採用する、或い
は、読み取るべき帳票自体に位置合わせ用のマーキング
を印刷しておくと共に、予め登録するテンプレート情報
にも、位置合わせ用のマーキングの位置情報を加えるこ
とにより、実際に入力された帳票画像をテンプレート情
報に重ね合わせる際には、そのマーキングを目印として
位置ずれを補償する等の方法が採られる。
Therefore, in order to prevent such a problem of misalignment, a conventional form processing apparatus employs a scanner having high transport accuracy for reading a form, or uses a scanner for positioning the form itself to be read. In addition to printing the marking of the mark, and adding the position information of the marking for alignment to the template information registered in advance, when superimposing the actually input form image on the template information, As a mark, a method of compensating for a displacement or the like is adopted.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上述し
た従来の位置合わせ手法は、帳票設計上の制約が大き
く、またテンプレート情報を基準とする処理なので、読
み取るべき帳票の物理的な状態が認識精度に与える影響
が大きいため、効率的な帳票処理を阻害する大きな要因
となる。
However, in the above-described conventional alignment method, there are great restrictions on the form design, and the processing is based on template information. Since the influence is large, it is a major factor that hinders efficient form processing.

【0006】そこで本発明は、正確且つ高精度に帳票処
理を行う帳票処理装置及び帳票処理方法の提供を目的と
する。
Accordingly, an object of the present invention is to provide a form processing apparatus and a form processing method for performing form processing accurately and with high accuracy.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る帳票処理装置は、以下の構成を特徴と
する。
To achieve the above object, a form processing apparatus according to the present invention has the following configuration.

【0008】即ち、処理対象の帳票に含まれるべき各領
域毎の位置情報及び所定の制御指示情報を含むテンプレ
ート情報に従って、入力された帳票画像に所定の処理を
施す帳票処理装置であって、入力された帳票画像の特徴
量に従って該帳票画像に含まれる領域を識別する領域識
別手段と、前記領域識別手段によって識別された各領域
に対して、前記テンプレート情報として予め記憶してい
る前記各領域毎の位置情報を重ね合わせることにより、
前記領域識別手段によって識別された各領域に対応する
領域を、前記テンプレート情報に含まれる各領域毎の位
置情報に基づいて検出し、その検出した領域とのずれ量
を個別に算出するずれ量算出手段と、前記ずれ量算出手
段によって算出したずれ量の最大値だけ、前記帳票画像
と前記テンプレート情報との相対的な位置を移動させる
ことにより、前記帳票画像に対する処理対象領域を決定
する決定手段とを備えることを特徴とする。
That is, a form processing apparatus for performing a predetermined process on an input form image in accordance with position information for each area to be included in a form to be processed and template information including predetermined control instruction information. Area identification means for identifying an area included in the form image in accordance with the feature amount of the form image thus obtained, and for each area identified by the area identification means, for each of the areas stored in advance as the template information By overlaying the location information of
A shift amount calculation that detects an area corresponding to each area identified by the area identification unit based on position information of each area included in the template information, and individually calculates a shift amount from the detected area. Means for determining a processing target area for the form image by moving a relative position between the form image and the template information by the maximum value of the amount of shift calculated by the shift amount calculating means; It is characterized by having.

【0009】また、例えば前記ずれ量算出手段は、前記
領域識別手段によって識別された各領域と、前記テンプ
レート情報として予め記憶している前記各領域毎の位置
情報を重ね合わせることによって生じる重複部分の面積
に基づいて、対応する領域を検出することを特徴とし、
更に好ましくは、前記領域識別手段によって識別された
ある領域に対して、前記重複部分の面積が複数存在する
ときには、前記テンプレート情報に含まれる各領域毎の
位置情報のうち、最も大きい重複部分を該領域と共にな
す領域の情報を、前記対応する領域として検出するとよ
い。
In addition, for example, the shift amount calculating means may calculate an overlapping portion generated by overlapping each area identified by the area identifying means with position information of each area previously stored as the template information. Detecting a corresponding region based on the area;
More preferably, when there is a plurality of areas of the overlapping portion with respect to a certain region identified by the region identifying means, the largest overlapping portion of the position information for each region included in the template information is referred to as the largest overlapping portion. It is preferable that information on an area formed together with the area is detected as the corresponding area.

【0010】また、例えば前記決定手段は、前記領域識
別手段によって識別された各領域の個数が前記テンプレ
ート情報に含まれる各領域毎の位置情報の個数より少な
いとき、前記対応する領域が検出できない前記テンプレ
ート情報に含まれる領域の位置情報を前記ずれ量に従っ
て移動させ、その移動後の領域が前記帳票画像と重複す
る部分を、前記処理対象領域として決定するとよい。
Further, for example, when the number of each area identified by the area identifying means is smaller than the number of position information for each area included in the template information, the determining means cannot detect the corresponding area. The position information of the area included in the template information may be moved according to the shift amount, and a portion where the moved area overlaps the form image may be determined as the processing target area.

【0011】または、上記の目的を達成するため、本発
明に係る帳票処理方法は、以下の構成を特徴とする。
Alternatively, in order to achieve the above object, a form processing method according to the present invention has the following configuration.

【0012】即ち、予め登録した処理対象の帳票に含ま
れるべき各領域毎の位置情報及び所定の制御指示情報を
含むテンプレート情報に従って、入力された帳票画像に
所定の処理を施す帳票処理方法であって、入力された帳
票画像の特徴量に従って該帳票画像に含まれる領域を識
別する領域識別工程と、前記領域識別工程にて識別した
各領域に対して、前記テンプレート情報に含まれる前記
各領域毎の位置情報を重ね合わせることにより、前記領
域識別工程にて識別した各領域に対応する領域を、前記
テンプレート情報に含まれる各領域毎の位置情報に基づ
いて検出し、その検出した領域とのずれ量を個別に算出
するずれ量算出工程と、前記ずれ量算出工程にて算出し
たずれ量の最大値だけ、前記帳票画像と前記テンプレー
ト情報との相対的な位置を移動させることにより、前記
帳票画像に対する処理対象領域を決定する決定工程とを
有することを特徴とする。
That is, a form processing method for performing a predetermined process on an input form image in accordance with position information of each region to be included in a form to be processed and template information including predetermined control instruction information. An area identifying step of identifying an area included in the form image in accordance with the feature amount of the input form image; and for each area identified in the area identifying step, By superimposing the position information, the region corresponding to each region identified in the region identification step is detected based on the position information for each region included in the template information, and the deviation from the detected region is detected. A shift amount calculating step of individually calculating the amount, and a relative value between the form image and the template information by a maximum value of the shift amount calculated in the shift amount calculating step. Position by moving the, and having a determination step of determining a processing target area for the form image.

【0013】[0013]

【発明の実施の形態】以下、本発明に係る帳票検索装置
の実施形態を、図面を参照して詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a form retrieval apparatus according to the present invention will be described below in detail with reference to the drawings.

【0014】図1は、本発明の一実施形態における帳票
検索装置の概略構成を示すブロック図である。
FIG. 1 is a block diagram showing a schematic configuration of a form retrieval apparatus according to an embodiment of the present invention.

【0015】同図において、スキャナ、カメラ等の画像
入力ユニット2によって読み取られた画像(本実施形態
では帳票画像)は、当該ユニット内で一般的な2値化処
理が施された後、デジタル画像データとしてプロセッサ
4に送られる。プロセッサ4は、入力された画像データ
に対して、一般的な画像特徴量の抽出処理として、例え
ば黒ドットのヒストグラム抽出法等の手法により、当該
画像(画像データ)を、テーブル、テキスト、画像等の
ブロック(領域)毎に分割する。更に、プロセッサ(C
PU)4は、例えば、抽出したブロックがテーブルブロ
ックであれば、一般的な罫線追跡処理等を施すことによ
って対象とするテーブルの詳細構造や、検出したテーブ
ル個数の計数値を更に求め、テキストブロックであれ
ば、一般的な文字認識処理を施すことによって文字コー
ドに変換する。このようにして取得した各領域の情報
は、テーブル構造データ及びテーブル個数データとし
て、RAM等のメモリ10及び/またはハードディスク
等の記憶装置8に保存される。
In FIG. 1, an image (a form image in the present embodiment) read by an image input unit 2 such as a scanner or a camera is subjected to a general binarization process in the unit, and then converted to a digital image. The data is sent to the processor 4 as data. The processor 4 converts the image (image data) into a table, a text, an image, or the like from the input image data by a method such as a histogram extraction method of black dots as a general image feature extraction process. Is divided for each block (region). Further, the processor (C
For example, if the extracted block is a table block, the PU) 4 further obtains a detailed structure of the target table by performing a general ruled line tracing process or the like and a count value of the number of detected tables, and If so, the character code is converted by performing a general character recognition process. The information of each area obtained in this manner is stored in the memory 10 such as a RAM and / or the storage device 8 such as a hard disk as table structure data and table number data.

【0016】また、プロセッサ4は、キーボード6より
入力されたテンプレート帳票の登録情報、検索等の命令
を受け取ると、記憶装置8等に記憶しているテーブル個
数データ、テーブル構造データ等を利用して、後述する
検索処理を行い、その検索結果を、ディスプレイ、プリ
ンタ等の出力装置12に出力する。
When the processor 4 receives the registration information of the template form and the command of the search input from the keyboard 6, the processor 4 utilizes the table number data, the table structure data and the like stored in the storage device 8 or the like. Then, a search process described later is performed, and the search result is output to an output device 12 such as a display or a printer.

【0017】上述したハードウエアの構成は、帳票処理
装置として専用に構成しても良いが、画像入力ユニット
2を接続可能な一般的なコンピュータに後述する検索処
理を行わせることによって構成しても良い。
The above-described hardware configuration may be dedicated to a form processing device, or may be configured by causing a general computer to which the image input unit 2 can be connected to perform a search process described later. good.

【0018】次に、本実施形態に係る帳票処理装置によ
る帳票処理の動作について説明する。以下に説明する処
理は、プロセッサ4が記憶装置8等に予め記憶している
プログラムに従って動作することにより実現される。
Next, the operation of the form processing by the form processing apparatus according to the present embodiment will be described. The processing described below is realized by the processor 4 operating according to a program stored in the storage device 8 or the like in advance.

【0019】図2は、本実施形態における帳票処理装置
による帳票処理を示すフローチャートであり、プロセッ
サ4が、画像入力ユニット2により読み込まれた1枚の
帳票画像を処理する際の全体の流れを示す。
FIG. 2 is a flowchart showing the form processing by the form processing apparatus according to the present embodiment, and shows the entire flow when the processor 4 processes one form image read by the image input unit 2. .

【0020】ステップS200:画像入力ユニット2に
より読み込まれた帳票画像を識別するルーチンであり、
例えば、帳票の所定位置にに予め印刷されている識別マ
ークを検出することによって識別しても良いし、帳票画
像のレイアウトを一般的な画像特徴量の抽出処理によっ
て解析することにより、どのような帳票なのかを識別し
ても良い。
Step S200: a routine for identifying a form image read by the image input unit 2,
For example, identification may be performed by detecting an identification mark printed in a predetermined position on a form in advance, or by analyzing the layout of the form image by general image feature amount extraction processing, You may identify whether it is a report.

【0021】ステップS202:ステップS200にお
ける帳票画像の識別結果に対応したテンプレート情報、
即ち、現在処理対象としている1枚の帳票画像のどの部
分に対しどのような処理(例えば、文字認識やバーコー
ドの読み取り等)を施すかを表わす処理対象ブロック
(以下、テンプレートブロック)を含む情報を、記憶装
置8よりメモリ10にロードする。ここで、本実施形態
では、処理対象の帳票を多数であるがある1種類の帳票
としているため、予め記憶装置8に登録しているテンプ
レート情報も、当該帳票に関する1種類のデータであ
る。従って、入力される帳票画像が複数種類である場合
には、予め記憶装置8に登録すべきテンプレート情報も
複数種類とすべきであり、且つ帳票処理時には、入力さ
れた1枚の帳票画像をどのテンプレート情報に対応させ
るかを決定する処理を本ステップにて行う必要がある。
Step S202: template information corresponding to the identification result of the form image in step S200,
That is, information including a processing target block (hereinafter, template block) indicating what processing (for example, character recognition or barcode reading, etc.) is to be performed on which part of one form image currently being processed. Is loaded from the storage device 8 into the memory 10. Here, in the present embodiment, since there are a large number of forms to be processed and one type of form, template information registered in the storage device 8 in advance is also one type of data relating to the form. Therefore, when there are a plurality of types of input form images, the template information to be registered in the storage device 8 in advance should also be of a plurality of types. It is necessary to perform a process of determining whether to correspond to the template information in this step.

【0022】ステップS204:現在処理対象としてい
る帳票画像の領域識別(領域分割)を行うルーチンであ
り、例えば特開平6−068301号に記述されている
ブロックセレクション技術等を採用すれば良い。本実施
形態では、係るブロックセレクション技術に基づいて、
ステップS200で入力した帳票画像に応じて、当該画
像に含まれる同一属性のブロック領域を抽出し、その抽
出した各ブロック領域の属性、大きさ、位置等の領域識
別情報を特定する。
Step S204: This is a routine for performing area identification (area division) of a form image to be processed at present, and may employ, for example, a block selection technique described in Japanese Patent Application Laid-Open No. 6-068301. In the present embodiment, based on the block selection technology,
According to the form image input in step S200, block regions having the same attribute included in the image are extracted, and region identification information such as the attribute, size, and position of each extracted block region is specified.

【0023】ステップS206:ステップS202でメ
モリ10に取り込んだテンプレート情報と、ステップS
204で抽出した領域識別情報とに基づいて、現在処理
対象としている帳票画像の中から所定の処理(本実施形
態では、文字認識処理)を行うべき処理対象領域を最終
的に決定する(詳細は後述する)。
Step S206: The template information fetched into the memory 10 in step S202 and the
Based on the area identification information extracted in step 204, a processing target area to be subjected to a predetermined process (in this embodiment, a character recognition process) is finally determined from the form image currently being processed (details are described in detail below). See below).

【0024】ステップS208:ステップS206で決
定された処理対象領域に対する所定の処理として、本実
施形態では一般的な文字認識処理を行う。
Step S208: In this embodiment, a general character recognition process is performed as a predetermined process for the processing target area determined in step S206.

【0025】次に、図2のステップS206における処
理の詳細について説明する。
Next, details of the processing in step S206 of FIG. 2 will be described.

【0026】図3は、本実施形態における帳票処理装置
が行う帳票処理のうち、処理対象領域の決定処理を示す
フローチャートであり、図2のステップS206の詳細
を示す。
FIG. 3 is a flowchart showing a process of determining a processing target area in the form processing performed by the form processing apparatus according to the present embodiment, and shows details of step S206 in FIG.

【0027】ステップS300:ステップS202で読
み込んだテンプレート情報に含まれるテンプレートブロ
ックと、ステップS204にて領域識別処理によって現
在処理対象としている帳票画像の中から抽出したブロッ
ク(以下、抽出ブロック)とを重ね合わせて、その重ね
合わせによって両ブロックが重複する面積が所定値以上
の面積を有する場合に、その抽出ブロックを処理対象領
域の候補として選別するブロック選別ルーチンである。
Step S300: The template block included in the template information read in step S202 is superimposed on the block (hereinafter, extracted block) extracted from the form image currently being processed by the area identification processing in step S204. In addition, a block selection routine for selecting the extracted block as a candidate for a processing target area when the area where both blocks overlap by the superposition has an area equal to or larger than a predetermined value.

【0028】ここで、ステップS300におけるブロッ
ク選別ルールを、図4を参照して説明する。このブロッ
ク選別ルールにおける基本的な選別手順は、 (1)抽出ブロックを基準として、テンプレートブロッ
クと重なった領域を検査対象領域とし、その検査対象領
域の面積が所定値以上の面積を有する抽出ブロックは、
処理対象領域の候補として残す(図4(a)参照)。
Here, the block selection rule in step S300 will be described with reference to FIG. The basic selection procedure in this block selection rule is as follows: (1) With respect to the extracted block, a region overlapping with the template block is set as an inspection target region. ,
It is left as a candidate for the processing target area (see FIG. 4A).

【0029】(2)図4(b)に示すように、複数のテ
ンプレートブロックにまたがって存在する抽出ブロック
については、それら複数のテンプレートブロックと抽出
ブロックとが重なり合うことによってできる複数の領域
のうち、面積が最大の領域を検査対象領域に設定する。
そして、その設定した検査対象領域の面積が所定値以上
の面積を有する抽出ブロックは、処理対象領域の候補と
して残す。
(2) As shown in FIG. 4 (b), with respect to an extracted block existing over a plurality of template blocks, of the plurality of regions formed by overlapping the plurality of template blocks and the extracted block, The area having the largest area is set as the inspection target area.
Then, the extracted block in which the area of the set inspection target area is equal to or larger than a predetermined value is left as a candidate of the processing target area.

【0030】(3)テンプレートブロックと抽出ブロッ
クとのずれ量計算のために後で使用するためのペアブロ
ックとして、上記の手順(1)または(2)で注目した
検査対象領域を共有するところの、抽出ブロックとテン
プレートブロックとを設定する。
(3) As a pair block to be used later for calculating the amount of displacement between the template block and the extracted block, the inspection target area noted in the above procedure (1) or (2) is shared. , An extraction block and a template block are set.

【0031】ステップS302:ステップS300で選
別された抽出ブロックと、その抽出ブロックとペアブロ
ックをなすテンプレートブロックとの中心座標のずれを
全てのペアブロックについて算出し、そのヒストグラム
を計算する。
Step S302: The deviation of the center coordinates between the extracted block selected in step S300 and the template block forming a pair with the extracted block is calculated for all the paired blocks, and the histogram is calculated.

【0032】ステップS304:代表ずれ量を計算す
る。ここで、代表ずれ量とは、大きさと方向を有する値
(ベクトル値)であり、ステップS302で算出したず
れ量ヒストグラムにピークが1つしか含まれない場合は
そのピーク値であり、ピークが複数の場合はそのうちの
最大値を示す値とする。
Step S304: The representative deviation amount is calculated. Here, the representative shift amount is a value (vector value) having a magnitude and a direction. If the shift amount histogram calculated in step S302 includes only one peak, the representative shift amount is the peak value. In the case of, a value indicating the maximum value is set.

【0033】ステップS306:ステップS300で選
別された抽出ブロック数が、テンプレートブロック数と
同じか否かを判断し(多い場合はあり得ない)、両ブロ
ックの数が同じときにはステップS308に進み、抽出
ブロック数がテンプレートブロック数より少ないときに
いはステップS310に進む。
Step S306: It is determined whether or not the number of extracted blocks selected in step S300 is the same as the number of template blocks (if it is large, it is impossible). If the number of both blocks is the same, the process proceeds to step S308 to extract When the number of blocks is smaller than the number of template blocks, the process proceeds to step S310.

【0034】ステップS308:ステップS301で選
別された抽出ブロック数とテンプレートブロック数が同
じなので、ステップS304で算出した代表ずれ量だけ
全テンプレートブロックを移動させ、この移動後に帳票
画像が当該テンプレートのテンプレートブロックと重な
り合う領域を、処理対象領域として最終的に決定する。
Step S308: Since the number of extracted blocks and the number of template blocks selected in step S301 are the same, all template blocks are moved by the representative deviation calculated in step S304, and after this movement, the form image is replaced with the template block of the template. Is finally determined as a processing target area.

【0035】ステップS310:ステップS301で選
別された抽出ブロック数がテンプレートブロック数より
少ないので、まず、ペアブロックをなすテンプレートブ
ロックについてはステップS304で算出した代表ずれ
量だけ移動させ、この移動後に帳票画像が当該テンプレ
ートのテンプレートブロックと重なり合う領域を、処理
対象領域として最終的に決定し、残りのテンプレートブ
ロックについてはステップS312にて対処する。
Step S310: Since the number of extracted blocks selected in step S301 is smaller than the number of template blocks, the template blocks forming a pair block are first moved by the representative deviation calculated in step S304, and after this movement, the form image Finally, an area overlapping with the template block of the template is determined as a processing target area, and the remaining template blocks are dealt with in step S312.

【0036】ステップS312:ステップS310で処
理対象領域が決定できなかった残りのテンプレートブロ
ック(孤立テンプレート)について、図5に示すよう
に、ステップS304で算出した代表ずれ量が表わす大
きさ及び方向に従って、ペアブロックが存在しない孤立
テンプレートブロックを移動させ、その移動後の領域を
処理対象領域と設定する。
Step S312: For the remaining template blocks (isolated templates) for which the processing target area could not be determined in step S310, as shown in FIG. 5, according to the size and direction represented by the representative displacement calculated in step S304. The isolated template block having no pair block is moved, and the area after the movement is set as the processing target area.

【0037】このように、本実施形態によれば、帳票ず
れ吸収のためのマーキングや、レイアウト上の制約を考
慮することなく、精度の高い帳票位置合わせが実現し、
また入力帳票毎に行う領域認識結果を基本に処理を行う
ので帳票自体の変形にも強く、帳票処理の効率を向上さ
せることができる。
As described above, according to the present embodiment, highly accurate form alignment can be realized without taking into account marking for absorbing form deviation and layout restrictions.
Further, since the processing is performed based on the area recognition result performed for each input form, the form itself is resistant to deformation and the efficiency of the form processing can be improved.

【0038】<第1の変形例>上述した実施形態におい
ては、複数のテンプレートブロックが抽出ブロックに重
なった場合に、その重なった部分の面積が最も大きいテ
ンプレートブロックをペアブロックとして設定したた
が、これに限るものでははなく、例えば、テンプレート
ブロック形状(例えば、縦横比等)が、抽出ブロックの
形状と近似しているものをペアブロックとしても良い。
或いは、上述した実施形態と同様にテンプレートブロッ
クと抽出ブロックとが重なった部分の面積と、形状の近
似とを両方加味した評価スコアを用いてペアブロックを
設定しても良い。
<First Modification> In the above-described embodiment, when a plurality of template blocks overlap with an extraction block, the template block having the largest area of the overlapping portion is set as a pair block. However, the present invention is not limited to this. For example, a template block shape (for example, an aspect ratio) that is similar to the shape of an extraction block may be used as a pair block.
Alternatively, as in the above-described embodiment, a pair block may be set using an evaluation score that takes into account both the area of the portion where the template block and the extracted block overlap and the approximation of the shape.

【0039】<第2の変形例>上述した実施形態におい
ては、図3のステップS310において、残されたブロ
ック数とテンプレートブロック数とが同じ場合に、代表
ずれ量だけテンプレートブロックを移動させ、その移動
後の領域を処理対象領域として設定したが、これに限る
ものではなく、例えばブロック数が同じで、ずれ量ヒス
トグラムのピークが1つしか存在しない場合は、抽出ブ
ロックを処理対象領域とし、ずれ量ヒストグラムのピー
クが1つ以上存在する場合は、代表ずれ量を示すテンプ
レートブロックに関しては抽出ブロックを処理対象領域
とし、それ以外の場合はテンプレートブロックを代表ず
れ量だけ移動した領域を処理対象領域としても良い。
<Second Modification> In the above-described embodiment, when the number of remaining blocks and the number of template blocks are the same in step S310 of FIG. 3, the template block is moved by the representative deviation amount, and The area after the movement is set as the processing target area. However, the present invention is not limited to this. For example, when the number of blocks is the same and only one peak of the shift amount histogram exists, the extracted block is set as the processing target area, If there is one or more peaks in the amount histogram, the extracted block is set as the processing target region for the template block indicating the representative deviation amount, and otherwise, the region in which the template block is moved by the representative deviation amount is set as the processing target region. Is also good.

【0040】[0040]

【他の実施形態】尚、本発明の目的は、前述した実施形
態の機能を実現するソフトウェアのプログラムコードを
記録した記憶媒体(または記録媒体)を、システムある
いは装置に供給し、そのシステムあるいは装置のコンピ
ュータ(またはCPUやMPU)が記憶媒体に格納されたプロ
グラムコードを読み出し実行することによっても、達成
されることは言うまでもない。この場合、記憶媒体から
読み出されたプログラムコード自体が前述した実施形態
の機能を実現することになり、そのプログラムコードを
記憶した記憶媒体は本発明を構成することになる。ま
た、コンピュータが読み出したプログラムコードを実行
することにより、前述した実施形態の機能が実現される
だけでなく、そのプログラムコードの指示に基づき、コ
ンピュータ上で稼働しているオペレーティングシステム
(OS)などが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれる。
Further, another object of the present invention is to provide a storage medium (or a recording medium) in which a program code of software for realizing the functions of the above-described embodiments is recorded to a system or an apparatus, and the system or the apparatus is provided. It is needless to say that the present invention can also be achieved by a computer (or CPU or MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. The functions of the above-described embodiments are not only realized by the computer executing the readout program code, but also the operating system running on the computer based on the instructions of the program code.
This includes the case where the (OS) performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0041】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張カード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張カードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれる。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the program code is read based on the instruction of the program code. This also includes the case where the CPU provided in the function expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0042】[0042]

【発明の効果】以上説明したように、本発明によれば、
正確且つ高精度に帳票処理を行う帳票処理装置及び帳票
処理方法の提供が実現する。
As described above, according to the present invention,
Provided is a form processing apparatus and a form processing method for performing form processing with accuracy and high accuracy.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態における帳票検索装置の概
略構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a schematic configuration of a form search device according to an embodiment of the present invention.

【図2】本実施形態における帳票処理装置による帳票処
理を示すフローチャートである。
FIG. 2 is a flowchart illustrating a form process performed by the form processing apparatus according to the embodiment.

【図3】本実施形態における帳票処理装置が行う帳票処
理のうち、処理対象領域の決定処理を示すフローチャー
トである。
FIG. 3 is a flowchart showing a process of determining a processing target area in form processing performed by the form processing apparatus according to the embodiment.

【図4】ブロック選別のルールを説明する図である。FIG. 4 is a diagram illustrating a rule of block selection.

【図5】孤立テンプレートについて処理対象領域を決定
する場合を説明する図である。
FIG. 5 is a diagram illustrating a case where a processing target area is determined for an isolated template.

【符号の説明】[Explanation of symbols]

2:画像入力ユニット, 4:プロセッサ, 6:キーボード, 8:記憶装置, 10:メモリ, 12:出力ユニット, 2: image input unit, 4: processor, 6: keyboard, 8: storage device, 10: memory, 12: output unit,

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 処理対象の帳票に含まれるべき各領域毎
の位置情報及び所定の制御指示情報を含むテンプレート
情報に従って、入力された帳票画像に所定の処理を施す
帳票処理装置であって、 入力された帳票画像の特徴量に従って該帳票画像に含ま
れる領域を識別する領域識別手段と、 前記領域識別手段によって識別された各領域に対して、
前記テンプレート情報として予め記憶している前記各領
域毎の位置情報を重ね合わせることにより、前記領域識
別手段によって識別された各領域に対応する領域を、前
記テンプレート情報に含まれる各領域毎の位置情報に基
づいて検出し、その検出した領域とのずれ量を個別に算
出するずれ量算出手段と、 前記ずれ量算出手段によって算出したずれ量の最大値だ
け、前記帳票画像と前記テンプレート情報との相対的な
位置を移動させることにより、前記帳票画像に対する処
理対象領域を決定する決定手段と、を備えることを特徴
とする帳票処理装置。
1. A form processing apparatus for performing predetermined processing on an input form image according to position information for each area to be included in a form to be processed and template information including predetermined control instruction information, Area identification means for identifying an area included in the form image according to the feature amount of the created form image, and for each area identified by the area identification means,
By superimposing the position information of each of the areas stored in advance as the template information, the area corresponding to each of the areas identified by the area identifying means is replaced with the position information of each of the areas included in the template information. And a displacement amount calculating means for individually calculating a displacement amount with respect to the detected area, and a relative value between the form image and the template information by a maximum value of the displacement amount calculated by the displacement amount calculating means. Determining means for determining a processing target area for the form image by moving a position of the form image.
【請求項2】 前記ずれ量算出手段は、前記領域識別手
段によって識別された各領域と、前記テンプレート情報
として予め記憶している前記各領域毎の位置情報を重ね
合わせることによって生じる重複部分の面積に基づい
て、対応する領域を検出することを特徴とする請求項1
記載の帳票処理装置。
2. The method according to claim 1, wherein the shift amount calculating unit is configured to overlap an area identified by the area identifying unit with position information of each area stored in advance as the template information. 2. A corresponding area is detected based on the following.
Form processing device as described.
【請求項3】 前記ずれ量算出手段は、前記領域識別手
段によって識別されたある領域に対して、前記重複部分
の面積が複数存在するときには、前記テンプレート情報
に含まれる各領域毎の位置情報のうち、最も大きい重複
部分を該領域と共になす領域の情報を、前記対応する領
域として検出することを特徴とする請求項2記載の帳票
処理装置。
3. When there is a plurality of areas of the overlapping portion with respect to a certain area identified by the area identifying means, the shift amount calculating means calculates position information of each area included in the template information. 3. The form processing apparatus according to claim 2, wherein information of an area forming a largest overlapping portion together with the area is detected as the corresponding area.
【請求項4】 前記決定手段は、前記領域識別手段によ
って識別された各領域の個数が前記テンプレート情報に
含まれる各領域毎の位置情報の個数より少ないとき、前
記対応する領域が検出できない前記テンプレート情報に
含まれる領域の位置情報を前記ずれ量に従って移動さ
せ、その移動後の領域が前記帳票画像と重複する部分
を、前記処理対象領域として決定することを特徴とする
請求項1記載の帳票処理装置。
4. The template which cannot detect the corresponding area when the number of each area identified by the area identifying means is smaller than the number of position information for each area included in the template information. 2. The form processing according to claim 1, wherein position information of an area included in the information is moved according to the shift amount, and a portion where the moved area overlaps with the form image is determined as the processing target area. apparatus.
【請求項5】 更に、前記位置合わせ手段による位置合
わせ後に、前記領域識別手段によって識別された各領域
に対して、前記テンプレート情報に含まれる所定の制御
指示情報に従って、文字認識を行う文字認識手段を備え
ることを特徴とする請求項1乃至請求項4の何れかに記
載の帳票処理装置。
5. A character recognizing means for performing character recognition on each area identified by the area identifying means according to predetermined control instruction information included in the template information after the positioning by the positioning means. The form processing apparatus according to claim 1, further comprising:
【請求項6】 予め登録した処理対象の帳票に含まれる
べき各領域毎の位置情報及び所定の制御指示情報を含む
テンプレート情報に従って、入力された帳票画像に所定
の処理を施す帳票処理方法であって、 入力された帳票画像の特徴量に従って該帳票画像に含ま
れる領域を識別する領域識別工程と、 前記領域識別工程にて識別した各領域に対して、前記テ
ンプレート情報に含まれる前記各領域毎の位置情報を重
ね合わせることにより、前記領域識別工程にて識別した
各領域に対応する領域を、前記テンプレート情報に含ま
れる各領域毎の位置情報に基づいて検出し、その検出し
た領域とのずれ量を個別に算出するずれ量算出工程と、 前記ずれ量算出工程にて算出したずれ量の最大値だけ、
前記帳票画像と前記テンプレート情報との相対的な位置
を移動させることにより、前記帳票画像に対する処理対
象領域を決定する決定工程と、を有することを特徴とす
る帳票処理方法。
6. A form processing method for performing predetermined processing on an input form image in accordance with position information of each area to be included in a form to be processed registered in advance and template information including predetermined control instruction information. An area identifying step of identifying an area included in the form image in accordance with the feature amount of the input form image; and for each of the areas identified in the area identifying step, for each of the areas included in the template information. By superimposing the position information, the region corresponding to each region identified in the region identification step is detected based on the position information for each region included in the template information, and the deviation from the detected region is detected. A shift amount calculating step of individually calculating the amount, and only the maximum value of the shift amount calculated in the shift amount calculating step,
Determining a region to be processed for the form image by moving a relative position between the form image and the template information.
【請求項7】 前記ずれ量算出工程において、前記領域
識別工程にて識別した各領域と、前記テンプレート情報
に含まれる前記各領域毎の位置情報を重ね合わせること
によって生じる重複部分の面積に基づいて、対応する領
域を検出することを特徴とする請求項6記載の帳票処理
方法。
7. In the shift amount calculating step, each area identified in the area identifying step is overlapped with position information of each area included in the template information, based on an area of an overlapping portion generated by overlapping each area. 7. The form processing method according to claim 6, wherein a corresponding area is detected.
【請求項8】 前記ずれ量算出工程において、前記領域
識別工程にて識別したある領域に対して、前記重複部分
の面積が複数存在するときには、前記テンプレート情報
に含まれる各領域毎の位置情報のうち、最も大きい重複
部分を該領域と共になす領域の情報を、前記対応する領
域として検出することを特徴とする請求項7記載の帳票
処理方法。
8. In the shift amount calculating step, when there is a plurality of areas of the overlapping portion with respect to a certain area identified in the area identifying step, the position information of each area included in the template information is obtained. 8. The form processing method according to claim 7, wherein information of an area forming a largest overlapping portion together with the area is detected as the corresponding area.
【請求項9】 前記決定工程において、前記領域識別工
程にて識別した各領域の個数が前記テンプレート情報に
含まれる各領域毎の位置情報の個数より少ないとき、前
記対応する領域が検出できない前記テンプレート情報に
含まれる領域の位置情報を前記ずれ量に従って移動さ
せ、その移動後の領域が前記帳票画像と重複する部分
を、前記処理対象領域として決定することを特徴とする
請求項6記載の帳票処理方法。
9. In the determining step, when the number of each area identified in the area identifying step is smaller than the number of pieces of position information for each area included in the template information, the corresponding template cannot be detected. 7. The form processing according to claim 6, wherein the position information of the area included in the information is moved according to the shift amount, and a portion where the moved area overlaps with the form image is determined as the processing target area. Method.
JP11133070A 1999-05-13 1999-05-13 Device and method for processing document Withdrawn JP2000322512A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11133070A JP2000322512A (en) 1999-05-13 1999-05-13 Device and method for processing document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11133070A JP2000322512A (en) 1999-05-13 1999-05-13 Device and method for processing document

Publications (1)

Publication Number Publication Date
JP2000322512A true JP2000322512A (en) 2000-11-24

Family

ID=15096150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11133070A Withdrawn JP2000322512A (en) 1999-05-13 1999-05-13 Device and method for processing document

Country Status (1)

Country Link
JP (1) JP2000322512A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057173A (en) * 2017-09-21 2019-04-11 キヤノン株式会社 Information processor, information processing method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057173A (en) * 2017-09-21 2019-04-11 キヤノン株式会社 Information processor, information processing method, and program
JP7013182B2 (en) 2017-09-21 2022-01-31 キヤノン株式会社 Information processing equipment, information processing methods and programs

Similar Documents

Publication Publication Date Title
EP1909215B1 (en) Image region detection method, recording medium, and device therefor
US7106904B2 (en) Form identification method
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
WO2011129113A1 (en) Form processing device, form processing method, and recording medium
JP2008192032A (en) Document processing device, document processing method, and program
JP4437756B2 (en) Information extraction method, information extraction apparatus, information extraction program, and storage medium
JP5111055B2 (en) Image processing apparatus, image processing method, and computer program
JP2002109521A (en) Device and method for processing document
JP2000322512A (en) Device and method for processing document
JP3600380B2 (en) Image processing method and fax character recognition device
JP4910635B2 (en) Image processing apparatus and image processing program
JP2002024838A (en) Image processing device and method, and recording medium
JP2009025856A (en) Document discrimination program and document discrimination device
JP2000339407A (en) Picture processor, picture processing method and computer readable storage medium
JP3814334B2 (en) Image processing apparatus and method
JP2012234345A (en) Form reader, square seal detection method, and square seal detection program
JP4379038B2 (en) Image collation apparatus, image collation method, and image collation program
JPH08329187A (en) Document reader
JP4390732B2 (en) Semiconductor wafer appearance inspection system
JP3946043B2 (en) Form identification device and identification method
JPH11272801A (en) Method for recognizing series of patterns in image and its detecting deformation and record medium where its program is recorded
JP4050677B2 (en) Image processing apparatus, image processing method, program, and recording medium
JP6225096B2 (en) Form reading program, form reading method, and information processing apparatus
JP2005301844A (en) Input device
JP5303230B2 (en) Image processing system and scanning electron microscope apparatus

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801