JP6148193B2 - Form definition creation device, form definition creation method, and program - Google Patents

Form definition creation device, form definition creation method, and program Download PDF

Info

Publication number
JP6148193B2
JP6148193B2 JP2014058977A JP2014058977A JP6148193B2 JP 6148193 B2 JP6148193 B2 JP 6148193B2 JP 2014058977 A JP2014058977 A JP 2014058977A JP 2014058977 A JP2014058977 A JP 2014058977A JP 6148193 B2 JP6148193 B2 JP 6148193B2
Authority
JP
Japan
Prior art keywords
item
image
diversion
definition
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014058977A
Other languages
Japanese (ja)
Other versions
JP2015184815A (en
Inventor
克夫 深沢
克夫 深沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2014058977A priority Critical patent/JP6148193B2/en
Publication of JP2015184815A publication Critical patent/JP2015184815A/en
Application granted granted Critical
Publication of JP6148193B2 publication Critical patent/JP6148193B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、帳票を電子化し、管理する帳票定義作成装置、帳票定義作成方法、および、プログラムに関する。   The present invention relates to a form definition creation apparatus, form definition creation method, and program for digitizing and managing forms.

従来、紙媒体などの帳票を、スキャナ等の画像読取装置で読取り、画像からOCR(工学文字認識)を行う際に、読取位置や桁数、文字種などを定義した書式定義と呼ばれる読取定義体が用いられている。   Conventionally, when a form such as a paper medium is read by an image reading device such as a scanner and OCR (engineering character recognition) is performed from an image, a reading definition body called a format definition that defines a reading position, the number of digits, a character type, and the like has been provided. It is used.

OCRの書式定義を新規に作成する場合、(1)帳票をスキャナなどから入力しイメージデータ化し、(2)書式定義プログラムにこの帳票イメージを読み込み、(3)表示されるイメージの上にマウスなどで枠を描くことで読取り位置を設定し、(4)作成した枠に桁数や文字種などを設定することで読み取り項目とする手順となる。このように、新たな帳票にて書式定義を作成する場合、読取項目を一つずつ利用者が定義していく必要があり、項目数が多いときは多くの時間がかかるため、作成する書式定義が多いと書式定義を作成するのに大変な労力を要する。   When creating a new OCR format definition, (1) a form is input from a scanner and converted into image data, (2) the form image is read into the format definition program, and (3) a mouse is displayed on the displayed image. The reading position is set by drawing a frame in step (4), and (4) the number of digits, the character type, etc. are set in the created frame to make the reading item. In this way, when creating a format definition with a new form, it is necessary for the user to define the reading items one by one, and it takes a lot of time when the number of items is large. If there are many, it will take a great effort to create a format definition.

そのため、類似した帳票の書式定義を作成する場合、1種類の帳票の書式定義を作成し、残りは書式定義を複写した後、読取項目の位置や桁数などを修正することで、工数を少なく書式定義を作成する方法が開発されている(特許文献1〜4参照)。   Therefore, when creating a format definition for a similar form, create one type of form definition, and after copying the format definition for the rest, modify the position of the reading item and the number of digits to reduce man-hours. A method for creating a format definition has been developed (see Patent Documents 1 to 4).

例えば、<1>新たな帳票をスキャナから入力してイメージデータ化し、書式定義プログラムに読み込み、<2>流用する帳票の書式定義を読み込み、先に読み込んだ帳票イメージの上に読取項目の枠を重ね合わせ、<3>読取項目の枠を帳票イメージの項目に合わせて移動し(桁数や枠のサイズが異なればそれらも変更し)、<4>不要な読取項目があれば削除し、新たな読取項目が必要なら作成する方法が開発されている。   For example, <1> a new form is input from the scanner, converted into image data, read into the format definition program, <2> the format definition of the diverted form is read, and a frame for the read item is placed on the previously read form image. Overlay, <3> Move the frame of the read item to the item of the form image (change the number of digits and frame size if they are different), <4> Delete any unnecessary read items, A method has been developed to create a simple reading item if necessary.

特開平7−160803号公報JP 7-160803 A 特開2001−229341号公報JP 2001-229341 A 特開2007−265389号公報JP 2007-265389 A 特開2009−53827号公報JP 2009-53827 A

しかしながら、書式定義を再利用する従来の方法では、元画像(流用元)と書式定義を新規作成する入力画像(流用先)のデザインが同一であることを前提としており、読取項目の移動や削除については対応できない、という問題点を有していた。   However, in the conventional method of reusing the format definition, it is assumed that the design of the original image (diversion source) and the input image (diversion destination) for creating a new format definition are the same. There was a problem that could not be handled.

より具体的には、書式定義を流用しようとする場合、印刷やスキャナ入力時の位置ずれや斜行、歪みにより、同一種類の帳票であっても読取項目の位置がずれたり、類似とはいえ別帳票であるため、帳票設計の変更により帳票上の読取項目が移動していたり、マーク項目の間隔が変化していたり、さらには読取項目が無くなっている場合がある。   More specifically, when trying to divert the format definition, the position of the reading item may be misaligned even if it is the same type of document due to misalignment, skew, or distortion during printing or scanner input. Since it is a separate form, the read item on the form may have moved due to a change in the form design, the interval between mark items may have changed, and there may be no read item.

そのため流用帳票の書式定義を読み込んだ後、利用者が読取項目をひとつひとつ、読取り位置やサイズの調整を行い、かつ、不要になった読取項目を探して削除を行う必要がある。たとえば、従来方法としてはマウスなどで読取項目を複数選択して一括移動するものがあるが、読取項目の位置ずれはすべての読取項目で同一ではないため、一括移動ではすべての読取り位置が合わず、最終的には、利用者がひとつひとつ読取項目の位置の微調整を行なう必要があるという問題点を有していた。   For this reason, after reading the format definition of the diverted form, the user needs to adjust the reading position and size one by one, and search for and delete unnecessary reading items. For example, as a conventional method, there is a method in which a plurality of reading items are selected with a mouse or the like and moved at a time, but since the positional deviation of the reading items is not the same for all the reading items, all the reading positions do not match in the batch movement. Finally, there is a problem that the user needs to finely adjust the position of the reading item one by one.

本発明は、上記問題点に鑑みてなされたもので、すでに作成された書式定義を的確に流用することができる、帳票定義作成装置、帳票定義作成方法、および、プログラムを提供することを目的とする。   The present invention has been made in view of the above problems, and an object thereof is to provide a form definition creation device, a form definition creation method, and a program capable of appropriately diverting an already created format definition. To do.

このような目的を達成するため、本発明の帳票定義作成装置は、文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置であって、上記記憶部は、流用元帳票の書式定義を記憶する書式定義記憶手段と、画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、を備え、上記制御部は、上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索手段と、上記項目位置探索手段による探索結果に基づいて、流用元帳票の読取項目を移動する項目対応付け手段と、を備える。   In order to achieve such an object, the form definition creating apparatus of the present invention is a form definition creating apparatus including at least a storage unit and a control unit for creating a format definition of a character recognition form, wherein the storage unit A format definition storage means for storing the format definition of the diversion source form; and an image storage means for storing an image of the diversion destination form read by the image reading device, wherein the control unit is a format of the diversion source form. Item position search means for searching individual read items based on the definition on the image of the diverted destination form, and item association means for moving the read items of the diversion source form based on the search result by the item position search means And comprising.

文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置において実行される帳票定義方法であって、上記記憶部は、流用元帳票の書式定義を記憶する書式定義記憶手段と、画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、を備え、上記制御部において実行される、上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、上記項目位置探索手段による探索結果に基づいて、流用元帳票の読取項目を移動する項目対応付けステップと、を含む。   A form definition method that is executed in a form definition creation device that includes at least a storage unit and a control unit to create a format definition for a character recognition form, wherein the storage unit stores a format definition of a diversion source form Definition storage means, and image storage means for storing an image of a diversion destination form read by the image reading apparatus, and each reading item based on the format definition of the diversion source form is executed in the control unit. And an item position searching step for searching on the image of the diversion destination form, and an item association step for moving the read item of the diversion source form based on the search result by the item position search means.

文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置に実行させるためのプログラムであって、上記記憶部は、流用元帳票の書式定義を記憶する書式定義記憶手段と、画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、を備え、上記制御部において、上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、上記項目位置探索手段による探索結果に基づいて、流用元帳票の読取項目を移動する項目対応付けステップと、を実行させる。   A program for creating a form definition for a character recognition form and causing a form definition creation apparatus having at least a storage unit and a control unit to execute the format definition for storing a format definition of a diversion source form Storage means and image storage means for storing an image of a diversion destination form read by the image reading device, and in the control unit, each reading item based on the format definition of the diversion source form is assigned to the diversion destination. An item position searching step for searching on the form image and an item association step for moving the read item of the diversion source form based on the search result by the item position searching means are executed.

この発明によれば、流用元と流用先のデザインが異なる場合であっても、流用元の書式定義を的確に流用することができるという効果を奏する。   According to the present invention, there is an effect that the format definition of the diversion source can be appropriately diverted even when the diversion source and the diversion destination are different in design.

図1は、本発明が適用される帳票定義作成装置の物理構成の一例を示すブロック図である。FIG. 1 is a block diagram showing an example of a physical configuration of a form definition creation apparatus to which the present invention is applied. 図2は、本発明が適用される帳票定義作成装置の機能構成の一例を示すブロック図である。FIG. 2 is a block diagram showing an example of a functional configuration of a form definition creation apparatus to which the present invention is applied. 図3は、本実施の形態における処理の一例を示すフローチャートである。FIG. 3 is a flowchart showing an example of processing in the present embodiment. 図4は、作成された書式定義の例を模式的に示した図である。FIG. 4 is a diagram schematically illustrating an example of the created format definition. 図5は、新たにスキャンした帳票画像の例を示す図である。FIG. 5 is a diagram illustrating an example of a newly scanned form image. 図6は、図5の帳票画像上において流用元の読取項目をそのまま対応付けた図である。FIG. 6 is a diagram in which the diversion source read items are directly associated with each other on the form image of FIG. 図7は、全体位置決めを行った結果を模式的に示した図である。FIG. 7 is a diagram schematically showing the result of overall positioning. 図8は、項目位置探索部102cにより設定された探索範囲の例を示す図である。FIG. 8 is a diagram illustrating an example of a search range set by the item position search unit 102c. 図9は、ステップSA−6の探索処理の一例を示すフローチャートである。FIG. 9 is a flowchart illustrating an example of the search process in step SA-6. 図10は、読取項目の移動を模式的に示した図である。FIG. 10 is a diagram schematically showing the movement of the reading item. 図11は、ある位置において、流用元の読取項目の画像と、流用先の帳票画像との、画素ごとの排他的論理和(XOR)を求めた図である。FIG. 11 is a diagram in which an exclusive OR (XOR) for each pixel of the diversion-source read item image and the diversion-destination form image is obtained at a certain position. 図12は、ある位置において、流用元の読取項目の画像と、流用先の帳票画像との、画素ごとの排他的論理和(XOR)を求めた図である。FIG. 12 is a diagram in which an exclusive OR (XOR) for each pixel of the diversion-source read item image and the diversion-destination form image is obtained at a certain position. 図13は、罫線マッチング手法の一例を示すフローチャートである。FIG. 13 is a flowchart illustrating an example of a ruled line matching method. 図14は、項目対応付け部102dの制御により、利用者に入力部112を介して項目の対応付けを行わせる例を示す図である。FIG. 14 is a diagram illustrating an example in which the user associates items via the input unit 112 under the control of the item association unit 102d. 図15は、探索範囲の重複による競合の例を示した図である。FIG. 15 is a diagram illustrating an example of contention due to overlapping search ranges. 図16は、競合有無の判断基準を説明するための図である。FIG. 16 is a diagram for explaining a criterion for determining the presence or absence of competition. 図17は、競合を解消させるための評価基準を説明するための図である。FIG. 17 is a diagram for explaining evaluation criteria for resolving the conflict. 図18は、探索範囲から除外される範囲を示す図である。FIG. 18 is a diagram illustrating a range excluded from the search range. 図19は、競合解消手法の一例を示すための図である。FIG. 19 is a diagram for illustrating an example of a conflict resolution method. 図20は、競合リストを追加した例を示す図である。FIG. 20 is a diagram illustrating an example in which a conflict list is added. 図21は、削除フラグをつけた例を示す図である。FIG. 21 is a diagram showing an example in which a deletion flag is added. 図22は、項目を更に記入枠に分割し、記入枠ごとに位置決めを行う例を示す図である。FIG. 22 is a diagram illustrating an example in which items are further divided into entry frames and positioning is performed for each entry frame.

以下に、本発明にかかる帳票定義作成装置、帳票定義作成方法、および、プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。   Embodiments of a form definition creation apparatus, form definition creation method, and program according to the present invention will be described below in detail with reference to the drawings. Note that the present invention is not limited to the embodiments.

[1.本実施形態の構成]
次に、図1を参照して、帳票定義作成装置の構成について説明する。図1は、本発明が適用される帳票定義作成装置の物理構成の一例を示すブロック図であり、図2は、本発明が適用される帳票定義作成装置の機能構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
[1. Configuration of this embodiment]
Next, the configuration of the form definition creation device will be described with reference to FIG. FIG. 1 is a block diagram illustrating an example of a physical configuration of a form definition creation apparatus to which the present invention is applied. FIG. 2 is a block diagram illustrating an example of a functional configuration of a form definition creation apparatus to which the present invention is applied. Yes, only the part related to the present invention is conceptually shown.

図1に示すように、本実施の形態の帳票定義作成装置は、コンピュータ10と、帳票画像を読み取るイメージスキャナ12と、キーボード13と、マウス11と、ディスプレイ14とを備える。なお、図示の物理構成は一例であり、本発明は、必ずしも該構成に限定されるものではない。   As shown in FIG. 1, the form definition creation apparatus according to the present embodiment includes a computer 10, an image scanner 12 that reads a form image, a keyboard 13, a mouse 11, and a display 14. The illustrated physical configuration is an example, and the present invention is not necessarily limited to this configuration.

図2に機能構成を示すように、本実施の形態の帳票定義作成装置100は、概略的に、制御部102(画像入力制御部102a、全体位置決め部102b、項目位置探索部102c、項目対応付け部102d、競合解消部102f)と、記憶部106(書式定義ファイル106a、画像ファイル106b)を備えて構成される。ここで、制御部102は、帳票定義作成装置100の全体を統括的に制御するCPU等である。また、記憶部106は、各種のデータベースやテーブルなどを格納する装置である。これら帳票定義作成装置100の各部は任意の通信路を介して通信可能に接続されている。なお、制御部102および記憶部106は、上述のコンピュータ10にて実現され、入力部112は、上述のイメージスキャナ12やキーボード13やマウス11等にて実現され、出力部114は、上述のディスプレイ14にて実現される。   As shown in the functional configuration of FIG. 2, the form definition creation apparatus 100 according to the present embodiment schematically includes a control unit 102 (an image input control unit 102 a, an overall positioning unit 102 b, an item position search unit 102 c, item association). Unit 102d, conflict resolution unit 102f), and storage unit 106 (format definition file 106a, image file 106b). Here, the control unit 102 is a CPU or the like that comprehensively controls the entire form definition creation device 100. The storage unit 106 is a device that stores various databases and tables. Each unit of the form definition creation apparatus 100 is connected to be communicable via an arbitrary communication path. The control unit 102 and the storage unit 106 are realized by the above-described computer 10, the input unit 112 is realized by the above-described image scanner 12, the keyboard 13, the mouse 11, and the like, and the output unit 114 is the above-mentioned display 14 is realized.

記憶部106は、ストレージ手段であり、各種のデータベースやテーブル(書式定義ファイル106a、画像ファイル106b等)を格納する。   The storage unit 106 is a storage unit, and stores various databases and tables (format definition file 106a, image file 106b, etc.).

記憶部106の各構成要素のうち、図1において、書式定義ファイル106aは、文字読取のための書式定義を記憶する書式定義記憶手段である。例えば、書式定義ファイル106aは、流用元帳票の書式定義を記憶してもよい。例えば、利用者がマウス11やキーボード13を操作して、画面に表示される帳票画像上に読取項目を設定し、読取項目の属性(手書き/活字、読取り文字種など)を設定することで、書式定義が作成される。ここで、図4は、作成された書式定義の例を模式的に示した図である。   Among the components of the storage unit 106, in FIG. 1, a format definition file 106a is a format definition storage unit that stores a format definition for character reading. For example, the format definition file 106a may store the format definition of the diversion source form. For example, when the user operates the mouse 11 or the keyboard 13 to set a reading item on a form image displayed on the screen and set the reading item attributes (handwritten / printed type, reading character type, etc.) A definition is created. Here, FIG. 4 is a diagram schematically showing an example of the created format definition.

図4に示すように、書式定義では、帳票画像の座標上で、読取項目が設定されており、読取項目に指定した範囲で、OCRによる読取対象となる。   As shown in FIG. 4, in the format definition, reading items are set on the coordinates of the form image, and are subject to reading by OCR within the range specified in the reading items.

また、画像ファイル106bは、入力部112の画像読取手段により読取られた帳票の画像および加工画像を記憶する。例えば、画像ファイル106bは、画像読取装置により読取られた流用先帳票の画像を記憶する。また、画像読取手段としての入力部112は、イメージスキャナ12のほか、デジタルカメラ、およびWEBカメラ等を用いることができる。   The image file 106b stores a form image and a processed image read by the image reading unit of the input unit 112. For example, the image file 106b stores an image of a diversion destination form read by the image reading device. In addition to the image scanner 12, a digital camera, a WEB camera, or the like can be used as the input unit 112 as an image reading unit.

また、制御部102は、OS(Operating System)等の制御プログラムや、各種の処理手順等を規定したプログラム、および、所要データを格納するための内部メモリを有する。そして、制御部102は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、図1において、機能概念的に、画像入力制御部102a、全体位置決め部102b、項目位置探索部102c、項目対応付け部102d、競合解消部102fを備えて構成されている。   The control unit 102 also has an internal memory for storing a control program such as an OS (Operating System), a program defining various processing procedures, and necessary data. And the control part 102 performs the information processing for performing various processes by these programs. In FIG. 1, the control unit 102 includes an image input control unit 102a, an overall positioning unit 102b, an item position search unit 102c, an item association unit 102d, and a conflict resolution unit 102f in terms of functional concept.

このうち、画像入力制御部102aは、入力部112を制御して、帳票の画像を取得し、画像ファイル106bに格納する。   Among these, the image input control unit 102a controls the input unit 112 to acquire a form image and store it in the image file 106b.

また、全体位置決め部102bは、流用元帳票と流用先帳票の画像全体の位置決めを行う。   The overall positioning unit 102b positions the entire images of the diversion source form and the diversion destination form.

また、項目位置探索部102cは、流用元帳票の書式定義に基づく個々の読取項目を、流用先帳票の画像上において探索する。ここで、項目位置探索部102cは、流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行ってもよい。例えば、項目位置探索部102cは、全体位置決め部102bによる流用元帳票と流用先帳票の画像全体の位置決め結果に基づいて、流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行う。これに限られず、項目位置探索部102cは、流用元帳票と流用先帳票の画像において文字認識を行い、流用先帳票の画像上において文字が対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行ってもよい。   In addition, the item position search unit 102c searches each read item based on the format definition of the diversion source form on the diversion destination form image. Here, the item position search unit 102c may search for the reading item within a predetermined range from the position of the reading item associated with the image on the diverted advance form. For example, the item position search unit 102c, based on the positioning result of the entire diversion source form and diversion destination form image by the overall positioning unit 102b, determines the predetermined read item position on the diversion destination form image from a predetermined reading item position. The read item is searched within the range. The item position search unit 102c is not limited to this, performs character recognition in the diversion source form and diversion destination form images, and within a predetermined range from the position of the read item associated with the characters in the diversion destination form image. The read item may be searched for.

また、項目対応付け部102dは、項目位置探索部102cによる探索結果に基づいて、流用元帳票の読取項目を移動させる。項目対応付け部102dは、項目を移動した結果を書式定義において定義して、書式定義ファイル106aに反映させてもよい。ここで、項目対応付け部102dは、項目位置探索部102cによる探索結果にて、対応する読取項目の位置が特定できなかった場合に、当該読取項目を削除する。   Further, the item association unit 102d moves the read item of the diversion original form based on the search result by the item position search unit 102c. The item association unit 102d may define the result of moving the item in the format definition and reflect it in the format definition file 106a. Here, the item association unit 102d deletes the read item when the position of the corresponding read item cannot be identified from the search result by the item position search unit 102c.

また、競合解消部102fは、項目対応付け部102dにより、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させる。例えば、競合解消部102fは、所定の評価基準に従って、当該評価基準に適合するように競合を解消させる。   In addition, the conflict resolution unit 102f resolves the conflict when the item association unit 102d associates a plurality of diversion source reading items with each other by sharing an area. For example, the conflict resolution unit 102f resolves the conflict according to a predetermined evaluation criterion so as to meet the evaluation criterion.

以上で本帳票定義作成装置100の構成の説明を終える。   This is the end of the description of the configuration of the form definition creation apparatus 100.

[2.本実施形態の処理]
次に、本実施の形態における処理の一例について、以下に図3から図22を参照して詳細に説明する。図3は、本実施の形態における処理の一例を示すフローチャートである。
[2. Processing of this embodiment]
Next, an example of processing in the present embodiment will be described in detail with reference to FIGS. 3 to 22 below. FIG. 3 is a flowchart showing an example of processing in the present embodiment.

図3に示すように、画像入力制御部102aは、入力部112の画像読取手段により読取られた紙(帳票)の画像を画像ファイル106bに格納するとともに、出力部114に表示する(ステップSA−1)。   As shown in FIG. 3, the image input control unit 102a stores the image of the paper (form) read by the image reading unit of the input unit 112 in the image file 106b and displays it on the output unit 114 (step SA- 1).

そして、全体位置決め部102bは、書式定義ファイル106aから、流用元となる帳票画像と書式定義を読み出す(ステップSA−2,SA−3)。   Then, the overall positioning unit 102b reads out the form image and the format definition as the diversion source from the format definition file 106a (steps SA-2 and SA-3).

そして、全体位置決め部102bは、流用元画像が、ステップSA−1で取得された流用先画像に重なるように、全体の位置合わせを行う(ステップSA−4)。ここで、図5は、新たにスキャンした帳票画像の例を示す図であり、図6は、図5の帳票画像上において流用元の読取項目をそのまま対応付けた図である。ここで、図中において、破線は、読取項目を表している(以下も同様)。   Then, the overall positioning unit 102b performs overall alignment so that the diversion source image overlaps the diversion destination image acquired in step SA-1 (step SA-4). Here, FIG. 5 is a diagram showing an example of a newly scanned form image, and FIG. 6 is a diagram in which the diversion-source read items are directly associated with each other on the form image of FIG. Here, in the figure, a broken line represents a reading item (the same applies to the following).

図5および図6に示すように、流用先の帳票画像の画像を基準として、流用元の帳票画像が流用先帳票画像に重なるように位置合わせ処理を行う場合、画像の左上角を基準点として重ねるような簡単な処理では、図6に示すように、全体的に読取位置がずれてしまう。そこで、全体位置決め部102bが、全体的な読取位置のずれを補正する。   As shown in FIG. 5 and FIG. 6, when the alignment process is performed so that the diversion source form image overlaps the diversion destination form image with reference to the diversion destination form image, the upper left corner of the image is used as a reference point. In a simple process of overlapping, as shown in FIG. 6, the reading position is shifted as a whole. Therefore, the overall positioning unit 102b corrects the overall reading position shift.

より具体的には、全体位置決め部102bは、流用元と流用先の双方の帳票画像から抽出した特徴点を対応付けてもよく、帳票の四隅に十字線などの基準点となる記号が予め印刷されている場合は、その記号を検出して全体位置合わせを行ってもよい。例えば、全体位置決め部102bは、3点の対応付けができれば、アフィン変換のパラメータを求めることができるため、おおざっぱな位置決めが可能となる。また、より簡便な方法として、全体位置決め部102bは、利用者が画像全体をマウスでドラッグすることで、位置ずれをおおざっぱに補正してもよい。ここで、図7は、全体位置決めを行った結果を模式的に示した図である。   More specifically, the overall positioning unit 102b may associate feature points extracted from both the diversion source and diversion form images, and symbols that serve as reference points such as crosshairs are printed in advance at the four corners of the form. If it is, the entire position may be aligned by detecting the symbol. For example, if the overall positioning unit 102b can associate three points, the affine transformation parameters can be obtained, so that rough positioning is possible. Further, as a simpler method, the overall positioning unit 102b may roughly correct the misalignment by the user dragging the entire image with the mouse. Here, FIG. 7 is a diagram schematically showing the result of overall positioning.

図7に示すように、新規に作成する帳票が流用したものから設計変更されている場合、読取項目の位置ずれや不一致が存在し、このままでは書式定義として使用できない。すなわち、用紙全体の位置ずれにより読取項目の位置がずれたり、枠の相対的な印刷位置が違うため、読取りフィールドの位置がずれる。そのため、本実施の形態は以下の処理を行う。   As shown in FIG. 7, when a newly created form has been redesigned from the diverted form, there are misalignments and inconsistencies in the read items, and the form definition cannot be used as it is. That is, the position of the reading item is shifted due to the position shift of the entire paper, or the position of the reading field is shifted because the relative printing position of the frame is different. Therefore, the present embodiment performs the following processing.

再び図3に戻り、項目位置探索部102cは、流用元帳票の書式定義に基づく個々の読取項目ごとの探索範囲を決定する(ステップSA−5)。項目位置探索部102cは、全体位置決め部102bによる画像全体の位置合せ処理結果において位置ずれを伴った画像上において、読取項目ごとの探索範囲を決定する。図8は、項目位置探索部102cにより設定された探索範囲の例を示す図である。   Returning to FIG. 3 again, the item position search unit 102c determines a search range for each read item based on the format definition of the diversion source form (step SA-5). The item position search unit 102c determines a search range for each read item on the image with a positional shift in the result of the alignment processing of the entire image by the overall positioning unit 102b. FIG. 8 is a diagram illustrating an example of a search range set by the item position search unit 102c.

図8に示すように、全体位置決め部102bによりが求められた位置決めパラメータを基準にして、流用元の書式定義の持つ読取項目の位置を補正するために、これに上下左右にマージンをつけて探索範囲を設定する。なお、探索範囲を決めるときのマージンの値は、予め決められた固定値でもよく、また、伸縮率を参考に与えるマージンを決定してもよい。たとえば、全体位置決め部102bがアフィン変換のパラメータを求めている場合、おおよその伸縮率を求めることができる。なお、全体位置決め部102bは、決定した探索範囲を記憶部106に一時記憶させる。   As shown in FIG. 8, in order to correct the position of the reading item of the format definition of the diversion source on the basis of the positioning parameter obtained by the overall positioning unit 102b, a search is performed with margins on the top, bottom, left and right. Set the range. Note that the margin value for determining the search range may be a fixed value determined in advance, or a margin for referring to the expansion / contraction rate. For example, when the overall positioning unit 102b obtains an affine transformation parameter, an approximate expansion / contraction rate can be obtained. The overall positioning unit 102 b temporarily stores the determined search range in the storage unit 106.

再び図3に戻り、項目位置探索部102cは、探索範囲にて探索を実行する(ステップSA−6)。例えば、項目位置探索部102cが、項目ごとに探索範囲内をパタンマッチすることで、項目のある位置を検出する。ここで、図9〜図13に具体的な位置合わせの手法の例を示す。図9は、ステップSA−6の探索処理の一例を示すフローチャートである。   Returning to FIG. 3 again, the item position search unit 102c executes a search within the search range (step SA-6). For example, the item position search unit 102c detects the position of the item by pattern matching within the search range for each item. Here, FIGS. 9 to 13 show examples of specific alignment methods. FIG. 9 is a flowchart illustrating an example of the search process in step SA-6.

図9に示すように、まず、項目位置探索部102cは、流用先帳票画像の探索範囲にて、読取項目を移動させる(ステップSA−61)。図10は、読取項目の移動を模式的に示した図である。例えば、項目位置探索部102cは、探索範囲の初期位置に読取項目を移動させ、処理を繰り返す毎に1ピクセルずつ読取項目をずらしてもよい。すなわち、図10に示すように、項目位置探索部102cは、流用元の帳票画像から読取項目に該当する部分の画像を切り出し、探索範囲内をずらしながら重ね合わせていき、最も合致する箇所を探す手法にて移動させてもよい。   As shown in FIG. 9, first, the item position search unit 102c moves the read item within the search range of the diverted destination form image (step SA-61). FIG. 10 is a diagram schematically showing the movement of the reading item. For example, the item position search unit 102c may move the reading item to the initial position of the search range and shift the reading item by one pixel each time the process is repeated. That is, as shown in FIG. 10, the item position search unit 102c cuts out the image corresponding to the read item from the diversion source form image, superimposes it while shifting the search range, and searches for the most matching part. It may be moved by a technique.

再び図9に戻り、項目位置探索部102cは、移動させた読取項目の画像と、流用先の帳票画像にて不一致の画素数をカウントする(ステップSA−62)。ここで、図11および図12は、ある位置において、流用元の読取項目の画像と、流用先の帳票画像との、画素ごとの排他的論理和(XOR)を求めた図である。   Returning to FIG. 9 again, the item position search unit 102c counts the number of pixels that do not match between the moved read item image and the diversion destination form image (step SA-62). Here, FIG. 11 and FIG. 12 are diagrams in which an exclusive OR (XOR) for each pixel of the diversion source read item image and the diversion destination form image is obtained at a certain position.

項目位置探索部102cは、項目に該当する画像部分をずらしながら、流用先の帳票画像と画素ごとに排他的論理和(XOR)を求める。これにより一致する画素の値は0、不一致の画素は1となるので、XORを取った後の画素値を合計することで一致度合いを判定できる。図11に示すように、その移動位置においてマッチングできていない場合は、マッチングがずれているため、排他的論理和で求められる画素数が多い。一方、図12に示すように、マッチングが良好の場合、画像が一致するため、排他的論理和にて求められる不一致画素数が少なくなる。   The item position search unit 102c obtains an exclusive OR (XOR) for each pixel image and the diverted form image while shifting the image portion corresponding to the item. As a result, the value of the matching pixel is 0, and the value of the non-matching pixel is 1. Therefore, the degree of matching can be determined by summing the pixel values after XOR. As shown in FIG. 11, when matching is not possible at the moving position, the matching is shifted, so that the number of pixels obtained by exclusive OR is large. On the other hand, as shown in FIG. 12, when the matching is good, the images match, so the number of mismatch pixels obtained by exclusive OR becomes small.

再び図9に戻り、項目位置探索部102cは、不一致画素の画素数がしきい値より少ないか否かを判定する(ステップSA−63)。探索範囲内を走査し、黒画素数がしきい値以下になる箇所を求めることで、合致する箇所を探すことができる。しきい値はたとえば、流用先画像の文字枠の範囲の面積に対する黒画素数の比率としてもよい。なお、流用元と流用先の2枚の画像は別の用紙のため、完全に一致するわけではなく、若干のずれが発生する。ずれの部分が差分として残るが、差分の上限にしきい値を設けることで、若干ずれてもマッチングしたと見なすことができる。   Returning to FIG. 9 again, the item position search unit 102c determines whether or not the number of non-matching pixels is smaller than a threshold value (step SA-63). By scanning the search range and finding a location where the number of black pixels is less than or equal to the threshold value, a matching location can be found. The threshold value may be, for example, the ratio of the number of black pixels to the area of the character frame range of the diversion destination image. Note that the two images of the diversion source and the diversion destination are different sheets, so they do not completely coincide with each other and a slight shift occurs. The part of the deviation remains as a difference, but by providing a threshold value at the upper limit of the difference, it can be considered that there is a match even if there is a slight deviation.

不一致画素数がしきい値よりも大きい場合(ステップSA−63,No)、項目位置探索部102cは、ステップSA−61に処理を戻し、項目位置を移動させて、上述したステップSA−61〜SA−63の処理を繰り返す。   When the number of mismatched pixels is larger than the threshold value (step SA-63, No), the item position search unit 102c returns the process to step SA-61, moves the item position, and performs the above-described steps SA-61 to SA-61. Repeat the process of SA-63.

一方、不一致画素数がしきい値よりも小さい場合(ステップSA−63,Yes)、項目位置探索部102cは、マッチング成功と判定する。探索範囲内に複数の文字枠が含まれる場合は、黒画素数がしきい値以下になる箇所を複数残すことで、複数の合致箇所を求めることができる。この際、同じ枠を二重に検出しないよう、合致箇所どうしの間隔がある程度空いたものを選択してもよい。   On the other hand, when the number of mismatch pixels is smaller than the threshold value (step SA-63, Yes), the item position search unit 102c determines that the matching is successful. When a plurality of character frames are included in the search range, a plurality of matching locations can be obtained by leaving a plurality of locations where the number of black pixels is equal to or less than the threshold value. At this time, it is also possible to select one having a certain distance between matching points so that the same frame is not detected twice.

なお、予め閾値を設定することに限られず、探索範囲を網羅的に探索して、不一致画素数が最小となった位置にてマッチングが成功したと判定してもよい。ここで、マッチング手法の別の例として、図13は、罫線マッチング手法の一例を示すフローチャートである。   Note that the threshold value is not limited to setting in advance, and the search range may be exhaustively searched, and it may be determined that the matching is successful at the position where the number of mismatched pixels is minimized. Here, as another example of the matching method, FIG. 13 is a flowchart illustrating an example of the ruled line matching method.

図9の上述した手法では文字枠のサイズが伸縮したときにマッチングが困難だが、以下に、図13を参照して説明するように、伸縮に対応したマッチングを行ってもよい。ここで、図13は、罫線で構成される文字枠の場合、罫線パタンを使ったマッチングを行う例である。罫線1本1本を新規帳票中の罫線と対応付けていくことで文字枠を見つけることができる。この方法では合致する罫線の長さに範囲を設けることで、サイズが伸縮したときの対応も容易である。   Although matching is difficult when the size of the character frame is expanded and contracted by the above-described method of FIG. 9, matching corresponding to expansion and contraction may be performed as described below with reference to FIG. Here, FIG. 13 is an example in which matching is performed using a ruled line pattern in the case of a character frame composed of ruled lines. A character frame can be found by associating each ruled line with a ruled line in a new form. In this method, by providing a range for the length of the ruled line that matches, it is easy to handle when the size is expanded or contracted.

図13に示すように、まず、項目位置探索部102cは、流用元の帳票の枠を構成するベクトルのうち、最も長いものを1本選択し、それに近いベクトルを流用先帳票から探す(ステップSA−611)。なお、図中の白抜きの線は、選択された最も長い線である。   As shown in FIG. 13, first, the item position search unit 102c selects one of the longest vectors among the vectors constituting the frame of the diversion source form, and searches the diversion destination form for a vector close thereto (step SA). -611). The white line in the figure is the longest selected line.

そして、項目位置探索部102cは、対応するベクトルが見つかると、このベクトルを基準として、流用元の帳票の枠の残りのベクトルの、流用先帳票上での探索範囲を決定する(ステップSA−612)。ここで、図13の破線は、探索範囲を示している。この探索範囲のサイズは、文字枠の伸縮の許容範囲や、イメージの伸縮の上限などから決定する。   When the item position search unit 102c finds a corresponding vector, the item position search unit 102c determines a search range on the diversion destination form for the remaining vectors of the diversion source form frame with reference to this vector (step SA-612). ). Here, the broken line in FIG. 13 indicates the search range. The size of this search range is determined from the allowable range of expansion and contraction of the character frame, the upper limit of expansion and contraction of the image, and the like.

そして、項目位置探索部102cは、探索範囲内に、流用元帳票の枠を構成するベクトルと類似の方向・長さのものが存在するか否かを探索する(ステップSA−613)。最終的に、枠全体に対して見つかった本数がしきい値(例えば80%)以上あれば、2つの枠が対応付いたと見なす(特開平11−3431の手法参照)。しきい値は、たとえば、流用画像の文字枠のベクトル本数に対する、見つかった本数の比率とする。   Then, the item position search unit 102c searches the search range to determine whether a vector having a direction and length similar to the vector constituting the diversion source form frame exists (step SA-613). Finally, if the number found for the entire frame is equal to or greater than a threshold value (for example, 80%), it is considered that the two frames correspond to each other (see the technique of Japanese Patent Laid-Open No. 11-3431). The threshold value is, for example, the ratio of the number found to the number of character frame vectors in the diverted image.

なお、上述した2つの手法のうち、どちらの処理が好ましいかは一意に決まらないため、システム設定で選択できるようにしてもよい。また無条件に削除を行った際も、削除箇所一覧を利用者に表示することが望ましい。なお、利用者が対応付かなかった読取項目を再設定してもよい。   Note that which of the two methods described above is preferable is not uniquely determined, and may be selected by system setting. In addition, it is desirable to display a deletion location list to the user even when deletion is performed unconditionally. Note that the reading items that the user did not correspond to may be reset.

再び図3に戻り、流用元の読取項目の一致パタンが見つかった場合(ステップSA−7,Yes)、項目対応付け部102dは、一致した位置に当該項目を移動させて、書式定義を変更する(ステップSA−8)。   Returning to FIG. 3 again, when the matching pattern of the diversion source reading item is found (step SA-7, Yes), the item association unit 102d moves the item to the matching position and changes the format definition. (Step SA-8).

一方、流用元の読取項目の一致パタンが見つからなかった場合(ステップSA−7,No)、項目対応付け部102dは、当該項目を削除または移動する(ステップSA−9)。なお、項目位置探索部102cの処理において一致パタンが見つからない場合、当該項目が新規帳票では削除されている(読取項目が無い)か、読取項目の形が変わったなどで、パタンマッチしなくなった(実際には読取項目がある)可能性が考えられる。この場合、帳票定義作成装置100は、無条件に読取項目の削除を行うか、もし実際には読取項目が存在する場合、新たに読取項目の定義を行ってもよい。ここで、図14は、項目対応付け部102dの制御により、利用者に入力部112を介して項目の対応付けを行わせる例を示す図である。   On the other hand, when the matching pattern of the diversion source read item is not found (step SA-7, No), the item association unit 102d deletes or moves the item (step SA-9). If the matching pattern is not found in the processing of the item position search unit 102c, the pattern does not match because the item has been deleted from the new form (no reading item) or the shape of the reading item has changed. (There is actually a reading item). In this case, the form definition creation apparatus 100 may delete the reading item unconditionally, or may newly define the reading item if the reading item actually exists. Here, FIG. 14 is a diagram illustrating an example in which the user associates items via the input unit 112 under the control of the item association unit 102d.

図14に示すように、項目位置探索部102cにて対応する項目が見つからない旨を利用者にメッセージを出し、その項目の情報を画面に表示する。利用者は帳票の内容から状況を判断し、読取項目が存在しなければ削除し、存在すればマウス等で読取項目を正しい場所に移動する。すなわち、この画面では、対応付かなかった項目が画面の端に一覧表示されるので、利用者はマウスでこれらの項目をイメージ上の正しい場所にドラッグすることで読取項目を再設定することができる。   As shown in FIG. 14, the item position search unit 102c issues a message to the user that the corresponding item is not found, and displays information about the item on the screen. The user determines the situation from the contents of the form, deletes the read item if it does not exist, and moves the read item to the correct location with a mouse or the like if it exists. That is, on this screen, items that have not been associated are listed at the edge of the screen, and the user can reset the reading items by dragging these items to the correct location on the image with the mouse. .

再び図3に戻り、競合解消部102fは、項目対応付け部102dにより、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させる(ステップSA−10)。ここで、競合の解消手法について、図15〜図22を参照して説明する。図15は、探索範囲の重複による競合の例を示した図である。図中のかぎ括弧にて、探索範囲を示す。   Returning to FIG. 3 again, the conflict resolving unit 102f resolves the conflict when the item association unit 102d associates a plurality of diversion-source read items with a shared area (step SA-10). ). Here, a conflict resolution method will be described with reference to FIGS. FIG. 15 is a diagram illustrating an example of contention due to overlapping search ranges. The search range is indicated by brackets in the figure.

図15に示すように、読取項目が同じ位置に対応付き、競合が発生する場合がある。項目位置探索部102cが探索範囲を決めたとき、項目どうしの距離が近いと、図15に示すように複数の読取項目の探索範囲が重複することが考えられる。この場合、たまたまその読取項目の形状が類似している場合、同じ場所に複数の読取項目を対応付ける可能性がある。これは明らかな競合であるため、重複を解消して1対1の対応付けとする必要がある。そこで、競合解消部102fは競合解消処理を行う。   As shown in FIG. 15, there is a case where a reading item is associated with the same position and a conflict occurs. When the item position search unit 102c determines the search range, if the distance between the items is short, the search ranges of a plurality of reading items may overlap as shown in FIG. In this case, when the shape of the reading item happens to be similar, there is a possibility that a plurality of reading items are associated with the same place. Since this is an obvious conflict, it is necessary to eliminate the duplication and make a one-to-one correspondence. Therefore, the conflict resolution unit 102f performs conflict resolution processing.

まず、項目位置探索部102cにより決定した読取項目のうち、競合しているものがあるか否かを調査する。図16は、競合有無の判断基準を説明するための図である。   First, it is investigated whether there is a conflicting reading item determined by the item position search unit 102c. FIG. 16 is a diagram for explaining a criterion for determining the presence or absence of competition.

一例として、図16に示すように、競合解消部102fは、破線で示す読取項目と、白抜きで示す読取項目との重なりが読取項目の面積の20%を越えている場合に、競合と判断してもよい。   As an example, as shown in FIG. 16, the conflict resolution unit 102f determines that there is a conflict when the overlap between the read item indicated by the broken line and the read item indicated by the white outline exceeds 20% of the area of the read item. May be.

次に、競合解消部102fは、競合している読取項目について競合を解消させるための評価値を算定する。ここで、図17は、競合を解消させるための評価基準を説明するための図である。   Next, the conflict resolution unit 102f calculates an evaluation value for resolving the conflict for the conflicting reading items. Here, FIG. 17 is a diagram for explaining an evaluation criterion for resolving the conflict.

図17に示すような帳票の評価基準の一例として、以下の基準を設定してもよい。
1) 検出した文字枠のサイズ(流用元と近い方が、評価値が高い)
2) 全体位置決めが推定した位置からのずれ(ずれの小さい方が、評価値が高い)
3) 当該読み取り項目の近傍の活字(流用元に同じ活字があれば、評価値が高い)
4) フィールドの並びの妥当性(「姓」項目は「名」項目の左側にある、「フリガナ」項目は「姓名」フィールドの上にある、マーク項目内の枠の順番は逆転しないなど)
The following criteria may be set as an example of the form evaluation criteria as shown in FIG.
1) The size of the detected character frame (the closer to the diversion source, the higher the evaluation value)
2) Deviation from the position estimated by the overall positioning (the smaller the deviation, the higher the evaluation value)
3) Type near the item to be read (if the diversion source has the same type, the evaluation value is high)
4) Validity of field arrangement ("First name" item is on the left side of "First name" item, "Name" item is above "First name" field, the order of the frames in the mark item is not reversed, etc.)

例えば、競合解消部102fは、これらの評価基準に基づいて、競合している読取り枠についての評価値を算出してもよい。算出方法として、たとえば、競合解消部102fは、これら4種類の評価のそれぞれに閾値を決め、閾値を越えていれば1、閾値を越えていない或いは不明であれば0を与える。たとえば、競合解消部102fは、1)について、文字枠のサイズの流用元との差が閾値以内であれば1を与え、全体位置決めからの位置ずれが閾値以内であれば1を与える等であってもよい。なお、評価値は0と1だけではなく、閾値を複数持つことで0から5までなど多段階の評価値を与えることも可能である。競合解消部102fは、すべての評価の合計をその読取項目の評価値とする。   For example, the conflict resolution unit 102f may calculate an evaluation value for the reading frame that is competing based on these evaluation criteria. As a calculation method, for example, the conflict resolution unit 102f determines a threshold value for each of these four types of evaluation, and gives 1 if the threshold value is exceeded, and gives 0 if the threshold value is not exceeded or unknown. For example, the contention resolution unit 102f gives 1) if the difference between the character frame size and the diversion source is within a threshold value, and gives 1 if the positional deviation from the overall positioning is within the threshold value. May be. Note that the evaluation value is not limited to 0 and 1, but a plurality of evaluation values such as 0 to 5 can be given by having a plurality of threshold values. The conflict resolution unit 102f uses the sum of all the evaluations as the evaluation value of the read item.

そして、競合解消部102fは、競合する読取り枠のすべての評価値を付けた後、最も高い評価値を持つ読取り枠が正しいと決定し、その位置に対応付く残りの読取項目の再探索を行う。この際、競合解消部102fは、対応付けが確定した場所は除外するように探索範囲を修正してもよい。ここで、図18は、探索範囲から除外される範囲を示す図である。   Then, the conflict resolving unit 102f determines that the reading frame having the highest evaluation value is correct after assigning all the evaluation values of the competing reading frames, and re-searches the remaining reading items corresponding to the position. . At this time, the conflict resolution unit 102f may correct the search range so as to exclude the place where the association has been determined. Here, FIG. 18 is a diagram illustrating a range excluded from the search range.

図18に示すように、競合解消部102fは、「分」の箇所で読取項目が確定した場合、他の読取項目の探索範囲から、当該確定した読取項目の領域を除外する。   As illustrated in FIG. 18, when the reading item is confirmed at the location “minute”, the conflict resolution unit 102 f excludes the determined reading item region from the search range of other reading items.

競合解消部102fは、再探索により新たな対応位置が見つかった場合、競合解消の処理を行い、また見つからなかった場合、上述した一致パタンが見つからない場合の処理を行う。このように、競合解消部102fは、探索と競合の解消を繰り返すことで、徐々に読取項目を決定していき、最終的な読取項目の位置決め結果を得ることができる。   The conflict resolution unit 102f performs conflict resolution processing when a new corresponding position is found by re-searching, and performs processing when the matching pattern is not found when it is not found. In this manner, the conflict resolution unit 102f can determine the reading item gradually by repeating the search and the resolution of the conflict, and obtain the final positioning result of the reading item.

競合解消部102fは、評価値が同一の場合、正しい読取項目がどれかを決定することができない。この場合、競合解消部102fは、当該読取項目については利用者にメッセージを表示し、利用者に入力部112を介して競合を解消するよう制御してもよい。この際、すべての競合を解消する方法もあり、またひとつの読取項目を利用者に決定してもらい、競合していた残りの読取項目はシステム側で自動的に再探索を行うことで、正しい位置を決める方法をとることもできる。   If the evaluation values are the same, the conflict resolution unit 102f cannot determine which is the correct reading item. In this case, the conflict resolution unit 102f may display a message to the user for the read item and control the user to resolve the conflict via the input unit 112. At this time, there is a method to resolve all the conflicts. Also, one reading item is determined by the user, and the remaining reading items that were in conflict are automatically re-searched on the system side, so that the correct one is obtained. A method of determining the position can also be taken.

また他の方法として、競合解消部102fは、読取項目をランダムにひとつ選択し、それを正しいものとすることもできる。この場合正しい場所に位置づかない可能性もあるが、最終的に利用者が目視確認するため、その段階で利用者が正しい位置に修正することができる。   As another method, the conflict resolution unit 102f can select one reading item at random and make it correct. In this case, there is a possibility that the user is not positioned at the correct location. However, since the user finally confirms visually, the user can correct the correct position at that stage.

競合解消部102fは、評価値の低いものを再探索するのではなく、各読取項目について、あらかじめ探索範囲内に対応付く複数の場所を求めておき、それらを評価値の高い順に候補として持つ手法を採用してもよい。こうすると探索が一度で済むので処理時間の短縮が期待できる。   The conflict resolving unit 102f does not search again for items with a low evaluation value, but obtains a plurality of locations corresponding to the search range in advance for each reading item and has them as candidates in descending order of the evaluation value. May be adopted. In this way, the search can be completed once, so the processing time can be shortened.

この手法を採る場合のデータ形式を図19に示す。図19は、競合解消手法の一例を示すための図である。   FIG. 19 shows a data format when this method is adopted. FIG. 19 is a diagram for illustrating an example of a conflict resolution method.

図19に示すように、流用元の書式定義上の各読取り領域は、流用先の帳票上の探索範囲内を探索した結果を、領域座標と評価値の2つの情報として保存する。この際、図19に示すように、候補は評価値の高い順に整列させる。   As shown in FIG. 19, each reading area on the diversion source format definition stores the search result in the search range on the diversion destination form as two pieces of information of area coordinates and evaluation values. At this time, as shown in FIG. 19, the candidates are arranged in descending order of evaluation values.

競合解消部102fは、すべての読取領域について候補を得た後、競合が存在するか否かのチェックを行う。これは、図19のデータ形式にある領域座標を使い、領域の重なりが閾値以上あるものを検出する。重なりが存在した場合、候補データに競合リストを追加する。図20は、競合リストを追加した例を示す図である。ここで、競合は(5,3)のように、競合する読取項目の番号と、その候補Noで表される。競合が存在しないときは空であることを示すNULLを設定する。   The conflict resolution unit 102f checks whether or not there is a conflict after obtaining candidates for all the reading regions. This uses area coordinates in the data format of FIG. 19 to detect areas where the overlap of areas is equal to or greater than a threshold. If there is an overlap, add a conflict list to the candidate data. FIG. 20 is a diagram illustrating an example in which a conflict list is added. Here, the conflict is represented by the number of the reading item to be conflicted and its candidate number as shown in (5, 3). When there is no conflict, NULL is set to indicate that it is empty.

次に、競合解消部102fは、各読取項目のうち、評価値の最も高い物をひとつ取り出して競合リストを参照する。競合するものが無ければその読取項目を確定として、次に評価値の高い読み取り項目の処理に移る。競合するものがあれば評価値を比較し、自らの評価値の方が高ければその読取項目を確定し、競合する他の読取項目の候補に削除フラグを付ける。図21は、削除フラグをつけた例を示す図である。なお、同一の場合は先に示した同一のときの処理を行って読取項目を確定する。   Next, the conflict resolution unit 102f takes out one item having the highest evaluation value from the read items and refers to the conflict list. If there is no conflict, the read item is determined, and the process proceeds to the read item with the next highest evaluation value. If there is a conflict, the evaluation values are compared. If the evaluation value is higher, the reading item is determined, and a deletion flag is attached to the candidate for other reading items that compete. FIG. 21 is a diagram showing an example in which a deletion flag is added. If they are the same, the above-described processing at the same time is performed to determine the reading item.

図21に示すように、これらの処理をすべての読取項目について行うことで、競合の無い読取項目の対応付けを行う。ここで、図22は、項目を更に記入枠に分割し、記入枠ごとに位置決めを行う例を示す図である。マーク項目の場合、個々のマーク枠の間隔が変わることがあるが、この方法をとることでマーク枠がずれることがなく位置決めが可能となる。マーク枠は同じ形をしたものが並ぶことが多く、競合が起きやすいが、同一マーク項目中の枠の左右・上下の関係は保存される場合が多いため、左右の関係や上下の関係を見て競合を解消する。   As shown in FIG. 21, these processes are performed for all the read items, thereby associating read items with no conflict. Here, FIG. 22 is a diagram illustrating an example in which items are further divided into entry frames and positioning is performed for each entry frame. In the case of a mark item, the interval between individual mark frames may change, but this method can be used to position the mark frame without shifting. Mark frames with the same shape are often lined up, and conflicts are likely to occur.However, because the left / right / up / down relationship of frames in the same mark item is often saved, check the left / right relationship and the up / down relationship. To resolve conflicts.

再び図3に処理を戻し、以上のように競合が解消されると、項目対応付け部102fは、流用先の書式定義を確定して書式定義ファイル106aに格納し、出力部114にて表示させる。   Returning to FIG. 3 again, when the conflict is resolved as described above, the item association unit 102f determines the format definition of the diversion destination, stores it in the format definition file 106a, and causes the output unit 114 to display it. .

以上で、本実施の形態における処理の一例の説明を終える。   Above, description of an example of the process in this Embodiment is finished.

[3.本実施形態のまとめ、及び他の実施形態]
以上、本実施形態によれば、文字認識用帳票の書式定義を作成する帳票定義作成装置100において、流用元帳票の書式定義を記憶し、画像読取装置により読取られた流用先帳票の画像を記憶し、流用元帳票の書式定義に基づく個々の読取項目を、流用先帳票の画像上において探索し、探索結果に基づいて、流用元帳票の読取項目を移動させる。これにより、既に作成された帳票定義を的確に流用することができる。より具体的には、読み取り項目のパタンだけを使い位置決めを行うため、読取り項目が移動していても、追従して位置決めが可能になる。これにより利用者が読取項目を手で移動する手間を削減できる。
[3. Summary of this embodiment and other embodiments]
As described above, according to the present embodiment, in the form definition creation device 100 that creates the format definition of the character recognition form, the format definition of the diversion source form is stored, and the image of the diversion destination form read by the image reading apparatus is stored. Then, individual reading items based on the format definition of the diversion source form are searched on the image of the diversion destination form, and the reading items of the diversion source form are moved based on the search result. Thereby, the already created form definition can be appropriately used. More specifically, since positioning is performed using only the pattern of the reading item, positioning can be performed following even if the reading item is moving. As a result, it is possible to reduce the time and effort for the user to move the reading item by hand.

また、本実施形態によれば、項目位置の探索処理を行う前に、流用元帳票と流用先帳票の画像全体の位置決めを行うので、位置ずれを解消させて、全体的な大まかな位置決めを行うことができる。   Further, according to the present embodiment, since the entire image of the diversion source form and the diversion destination form is positioned before the item position search process is performed, the positional deviation is eliminated and the overall positioning is performed. be able to.

また、本実施形態によれば、流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行うので、探索範囲を限定することで効率よく書式定義を流用することができる。   Further, according to the present embodiment, since the search for the read item is performed within a predetermined range from the position of the corresponding read item on the diversion destination form image, the format can be efficiently formed by limiting the search range. Definitions can be diverted.

また、本実施形態によれば、全体位置決めによる流用元帳票と流用先帳票の画像全体の位置決め結果に基づいて、流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行う。これにより本実施形態は、全体位置決めによる大まかな位置を出発点とすることで、効率よく探索を行うことができる。   Further, according to the present embodiment, based on the positioning result of the entire diversion source form and diversion destination form image by the overall positioning, within the predetermined range from the position of the corresponding read item on the diversion destination form image The search for the reading item is performed. Thereby, this embodiment can search efficiently by making the rough position by whole positioning into a starting point.

また、本実施形態によれば、項目対応付けにより、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させるので、本実施形態は、競合がある場合に精度よく検出することができる。すなわち、競合する読取り領域のひとつまたは複数を移動あるいは削除することで、残りの競合する読取り項目の位置を、評価値に基づき自動的に再配置することができる。   In addition, according to the present embodiment, when a plurality of diversion source reading items are associated with each other by sharing an area by the item association, the conflict is resolved. Therefore, the present embodiment has a conflict. Can be detected with high accuracy. That is, by moving or deleting one or more of the conflicting reading areas, the positions of the remaining conflicting reading items can be automatically rearranged based on the evaluation value.

また、本実施形態によれば、所定の評価基準に従って、当該評価基準に適合するように競合を解消させるので、評価基準に沿った好適な帳票定義を作成することができる。   Further, according to the present embodiment, according to a predetermined evaluation standard, the conflict is resolved so as to meet the evaluation standard, so that a suitable form definition along the evaluation standard can be created.

また、本実施形態によれば、項目位置の探索結果にて、対応する読取項目の位置が特定できなかった場合に、当該読取項目を削除するので、不要な読取項目を自動的に判別して削除することができる。   Further, according to the present embodiment, when the position of the corresponding reading item cannot be specified by the search result of the item position, the reading item is deleted, so that the unnecessary reading item is automatically determined. Can be deleted.

さらに、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。   Furthermore, although the embodiment of the present invention has been described so far, the present invention is not limited to the above-described embodiment, but can be implemented in various different embodiments within the scope of the technical idea described in the claims. It may be implemented.

例えば、帳票定義作成装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、帳票定義作成装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。   For example, the case where the form definition creation apparatus 100 performs processing in a stand-alone form has been described as an example. However, the form definition creation apparatus 100 performs processing in response to a request from a client terminal configured in a separate housing from the form definition creation apparatus 100, You may comprise so that the process result may be returned to the said client terminal.

また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。   In addition, among the processes described in the embodiment, all or part of the processes described as being automatically performed can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method.

このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。   In addition, unless otherwise specified, the processing procedures, control procedures, specific names, information including registration data for each processing, parameters such as search conditions, screen examples, and database configurations shown in the above documents and drawings Can be changed arbitrarily.

また、帳票定義作成装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。   In addition, regarding the form definition creation device 100, each illustrated component is functionally conceptual and does not necessarily need to be physically configured as illustrated.

例えば、帳票定義作成装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する記録媒体に記録されており、必要に応じて帳票定義作成装置100に機械的に読み取られる。すなわち、ROMまたはHDD(Hard Disk Drive)等の記憶部106は、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部102を構成する。   For example, regarding the processing functions provided in each device of the form definition creation device 100, in particular, each processing function performed by the control unit 102, all or any part thereof is interpreted by a CPU (Central Processing Unit) and the CPU. It may be realized by a program to be executed, or may be realized as hardware by wired logic. The program is recorded on a recording medium to be described later, and is mechanically read by the form definition creation device 100 as necessary. That is, a storage unit 106 such as a ROM or a HDD (Hard Disk Drive) stores a computer program that cooperates as an OS (Operating System) to give instructions to the CPU and perform various processes. This computer program is executed by being loaded into the RAM, and constitutes the control unit 102 in cooperation with the CPU.

また、このコンピュータプログラムは、帳票定義作成装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。   The computer program may be stored in an application program server connected to the form definition creation device 100 via an arbitrary network, and may be downloaded in whole or in part as necessary. It is.

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD、Blu−ray(登録商標) Disc等の任意の「可搬用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。   The program according to the present invention can also be stored in a computer-readable recording medium. Here, the “recording medium” is an arbitrary “portable physical medium” such as a flexible disk, magneto-optical disk, ROM, EPROM, EEPROM, CD-ROM, MO, DVD, Blu-ray (registered trademark) Disc, etc. Or a “communication medium” that holds the program in a short period of time, such as a communication line or carrier wave in the case of transmitting the program via a network represented by LAN, WAN, or the Internet.

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。   The “program” is a data processing method described in an arbitrary language or description method, and may be in any format such as source code or binary code. The “program” is not necessarily limited to a single configuration, but is distributed in the form of a plurality of modules and libraries, or in cooperation with a separate program represented by an OS (Operating System). Including those that achieve the function. Note that a well-known configuration and procedure can be used for a specific configuration for reading a recording medium, a reading procedure, an installation procedure after reading, and the like in each device described in the embodiment.

記憶部106に格納される各種のデータベース等は、RAM、SSD、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやデータベースやウェブページ用ファイル等を格納する。   Various databases and the like stored in the storage unit 106 are storage means such as a memory device such as a RAM, SSD, and ROM, a fixed disk device such as a hard disk, a flexible disk, and an optical disk. Stores programs, tables, databases, web page files, etc.

また、帳票定義作成装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。   Further, the form definition creation device 100 is connected to an information processing device such as a known personal computer or workstation, and software (including a program, data, etc.) for realizing the method of the present invention is installed in the information processing device. May be realized.

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Furthermore, the specific form of distribution / integration of the devices is not limited to that shown in the figure, and all or a part of them may be functional or physical in arbitrary units according to various additions or according to functional loads. Can be distributed and integrated.

以上詳細に説明したように、本発明によれば、既に作成された帳票定義を的確に流用することができる、帳票定義作成装置、帳票定義作成方法、および、プログラムを提供することができ、特にスキャナで読み取った画像に関する画像処理分野で実施する場合に極めて有用である。   As described above in detail, according to the present invention, it is possible to provide a form definition creation device, a form definition creation method, and a program that can appropriately divert already created form definitions. This is extremely useful when implemented in the field of image processing relating to an image read by a scanner.

10 コンピュータ
11 マウス
12 イメージスキャナ
13 キーボード
14 ディスプレイ
100 帳票定義作成装置
102 制御部
102a 画像入力制御部
102b 全体位置決め部
102c 項目位置探索部
102d 項目対応付け部
102f 競合解消部
106 記憶部
106a 書式定義ファイル
106b 画像ファイル
108 入出力制御インターフェース部
112 入力部
114 出力部
104 通信制御インターフェース部
200 外部機器
DESCRIPTION OF SYMBOLS 10 Computer 11 Mouse | mouth 12 Image scanner 13 Keyboard 14 Display 100 Form definition creation apparatus 102 Control part 102a Image input control part 102b Whole positioning part 102c Item position search part 102d Item matching part 102f Conflict resolution part 106 Storage part 106a Format definition file 106b Image file 108 Input / output control interface unit 112 Input unit 114 Output unit 104 Communication control interface unit 200 External device

Claims (10)

文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置であって、
上記記憶部は、
流用元帳票の書式定義を記憶する書式定義記憶手段と、
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、
を備え、
上記制御部は、
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索手段と、
上記項目位置探索手段による探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付け手段と、
上記項目位置探索手段による処理を行う前に、流用元帳票と流用先帳票の画像全体の位置決めを行う全体位置決め手段
を備える帳票定義作成装置。
A form definition creation device comprising at least a storage unit and a control unit for creating a format definition for a character recognition form,
The storage unit
Format definition storage means for storing the format definition of the diversion ledger,
Image storage means for storing an image of the diverted advance form read by the image reading device;
With
The control unit
Item position search means for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form,
Based on the search result by the item position search means, an item association means for moving the read item of the diversion original form,
Before performing the process according to the item position search unit, the overall positioning means for positioning the entire image of the diverted destination form a diversion original form,
Form definition creating apparatus comprising a.
請求項に記載の帳票定義作成装置において、
上記項目位置探索手段は、
流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行う帳票定義作成装置。
In the form definition creation device according to claim 1 ,
The item position search means includes:
A form definition creation device that searches for a read item within a predetermined range from the position of a corresponding read item on an image of a diversion destination form.
請求項に記載の帳票定義作成装置において、
上記項目位置探索手段は、
上記全体位置決め手段による流用元帳票と流用先帳票の画像全体の位置決め結果に基づいて、流用先帳票の画像上における対応付けられた読取項目の位置から、所定の範囲内で当該読取項目の探索を行う帳票定義作成装置。
In the form definition creation device according to claim 1 ,
The item position search means includes:
Based on the positioning result of the entire diversion source form and diversion destination form image by the overall positioning unit, the reading item is searched within a predetermined range from the position of the corresponding reading item on the diversion destination form image. Form definition creation device to perform.
文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置であって、
上記記憶部は、
流用元帳票の書式定義を記憶する書式定義記憶手段と、
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、
を備え、
上記制御部は、
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索手段と、
上記項目位置探索手段による探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付け手段と、
上記項目対応付け手段により、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させる競合解消手段
を備える帳票定義作成装置。
A form definition creation device comprising at least a storage unit and a control unit for creating a format definition for a character recognition form,
The storage unit
Format definition storage means for storing the format definition of the diversion ledger,
Image storage means for storing an image of the diverted advance form read by the image reading device;
With
The control unit
Item position search means for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form,
Based on the search result by the item position search means, an item association means for moving the read item of the diversion original form,
The above list correlating means, when a plurality of read items diverted source, associated share regions each other, a conflict resolution means for resolving the conflict,
Form definition creating apparatus comprising a.
請求項に記載の帳票定義作成装置において、
上記競合解消手段は、
所定の評価基準に従って、当該評価基準に適合するように競合を解消させる帳票定義作成装置。
In the form definition creation device according to claim 4 ,
The above conflict resolution means
A form definition creation device that resolves a conflict so as to meet a predetermined evaluation standard.
請求項1乃至のいずれか一つに記載の帳票定義作成装置において、
上記項目対応付け手段は、
上記項目位置探索手段による探索結果にて、対応する読取項目の位置が特定できなかった場合に、当該読取項目を削除する帳票定義作成装置。
In the form definition creation device according to any one of claims 1 to 5 ,
The item association means
A form definition creation device that deletes a read item when the position of the corresponding read item cannot be identified from the search result by the item position search means.
文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置において実行される帳票定義方法であって、
上記記憶部は、
流用元帳票の書式定義を記憶する書式定義記憶手段と、
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、
を備え、
上記制御部において実行される、
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、
上記項目位置探索ステップにおける探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付けステップと、
上記項目位置探索ステップの処理を行う前に、流用元帳票と流用先帳票の画像全体の位置決めを行う全体位置決めステップと、
を含むことを特徴とする、帳票定義作成方法。
A form definition method that is executed in a form definition creation device that includes at least a storage unit and a control unit to create a format definition of a form for character recognition,
The storage unit
Format definition storage means for storing the format definition of the diversion ledger,
Image storage means for storing an image of the diverted advance form read by the image reading device;
With
Executed in the control unit,
An item position search step for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form;
Based on the search result in the item position search step, an item association step for moving the read item of the diversion source form,
Before performing the processing of the item position search step, an overall positioning step for positioning the entire image of the diversion source form and the diversion destination form,
A form definition creation method characterized by including:
文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置において実行される帳票定義方法であって、A form definition method that is executed in a form definition creation device that includes at least a storage unit and a control unit to create a format definition of a form for character recognition,
上記記憶部は、The storage unit
流用元帳票の書式定義を記憶する書式定義記憶手段と、Format definition storage means for storing the format definition of the diversion ledger,
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、Image storage means for storing an image of the diverted advance form read by the image reading device;
を備え、With
上記制御部において実行される、Executed in the control unit,
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、An item position search step for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form;
上記項目位置探索ステップにおける探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付けステップと、Based on the search result in the item position search step, an item association step for moving the read item of the diversion source form,
上記項目対応付けステップにおいて、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させる競合解消ステップと、In the item association step, when a plurality of diversion source reading items are associated with each other by sharing an area, a conflict resolving step for resolving the conflict,
を含むことを特徴とする、帳票定義作成方法。A form definition creation method characterized by including:
文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置に実行させるためのプログラムであって、
上記記憶部は、
流用元帳票の書式定義を記憶する書式定義記憶手段と、
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、
を備え、
上記制御部において、
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、
上記項目位置探索ステップにおける探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付けステップと、
上記項目位置探索ステップの処理を行う前に、流用元帳票と流用先帳票の画像全体の位置決めを行う全体位置決めステップと、
を実行させるためのプログラム。
A program for creating a form definition for a character recognition form and causing a form definition creation apparatus having at least a storage unit and a control unit to execute the format definition,
The storage unit
Format definition storage means for storing the format definition of the diversion ledger,
Image storage means for storing an image of the diverted advance form read by the image reading device;
With
In the control unit,
An item position search step for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form;
Based on the search result in the item position search step, an item association step for moving the read item of the diversion source form,
Before performing the processing of the item position search step, an overall positioning step for positioning the entire image of the diversion source form and the diversion destination form,
A program for running
文字認識用帳票の書式定義を作成する、記憶部と制御部を少なくとも備えた帳票定義作成装置に実行させるためのプログラムであって、A program for creating a form definition for a character recognition form and causing a form definition creation apparatus having at least a storage unit and a control unit to execute the format definition,
上記記憶部は、The storage unit
流用元帳票の書式定義を記憶する書式定義記憶手段と、Format definition storage means for storing the format definition of the diversion ledger,
画像読取装置により読取られた流用先帳票の画像を記憶する画像記憶手段と、Image storage means for storing an image of the diverted advance form read by the image reading device;
を備え、With
上記制御部において、In the control unit,
上記流用元帳票の書式定義に基づく個々の読取項目を、上記流用先帳票の画像上において探索する項目位置探索ステップと、An item position search step for searching for individual reading items based on the format definition of the diversion source form on the image of the diversion destination form;
上記項目位置探索ステップにおける探索結果に基づいて、流用元帳票の読取項目を移動させる項目対応付けステップと、Based on the search result in the item position search step, an item association step for moving the read item of the diversion source form,
上記項目対応付けステップにおいて、流用元の複数の読取項目が、互いに領域を共有して対応づけられた場合に、競合を解消させる競合解消ステップと、In the item association step, when a plurality of diversion source reading items are associated with each other by sharing an area, a conflict resolving step for resolving the conflict,
を実行させるためのプログラム。A program for running
JP2014058977A 2014-03-20 2014-03-20 Form definition creation device, form definition creation method, and program Active JP6148193B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014058977A JP6148193B2 (en) 2014-03-20 2014-03-20 Form definition creation device, form definition creation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014058977A JP6148193B2 (en) 2014-03-20 2014-03-20 Form definition creation device, form definition creation method, and program

Publications (2)

Publication Number Publication Date
JP2015184815A JP2015184815A (en) 2015-10-22
JP6148193B2 true JP6148193B2 (en) 2017-06-14

Family

ID=54351300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014058977A Active JP6148193B2 (en) 2014-03-20 2014-03-20 Form definition creation device, form definition creation method, and program

Country Status (1)

Country Link
JP (1) JP6148193B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021043775A (en) 2019-09-12 2021-03-18 富士ゼロックス株式会社 Information processing device and program
JP2021131659A (en) * 2020-02-19 2021-09-09 キヤノンマーケティングジャパン株式会社 Information processor, control method and program
JP2023140051A (en) 2022-03-22 2023-10-04 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934989A (en) * 1995-07-20 1997-02-07 Hitachi Electron Eng Co Ltd Format parameter generating method for ocr
JPH09204422A (en) * 1996-01-26 1997-08-05 Casio Comput Co Ltd Read data processor
JP3394694B2 (en) * 1997-08-29 2003-04-07 沖電気工業株式会社 Format information registration method and OCR system
JP2000172779A (en) * 1998-12-03 2000-06-23 Toshiba Corp Ocr system and method for generating read control information to be applied to the system
JP2001084254A (en) * 1999-09-10 2001-03-30 Toshiba Corp Electronic filing system and filing method
JP2002298081A (en) * 2001-03-30 2002-10-11 Toshiba Corp Optical character recognition device and field definition method of document reading definition body
JP2005092597A (en) * 2003-09-18 2005-04-07 Trans Cosmos Inc Documents reader, its program, scanning device, invisible image print controlling unit, its program, and sheet shape medium
JP2007279828A (en) * 2006-04-03 2007-10-25 Toshiba Corp Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format
JP2007323474A (en) * 2006-06-02 2007-12-13 Nec Corp Ocr system, ocr format parameter preparation method, its program and program recording medium
JP4867941B2 (en) * 2008-03-24 2012-02-01 沖電気工業株式会社 Form processing method, form processing program, form processing apparatus, and form processing system
JP2011013960A (en) * 2009-07-02 2011-01-20 Ricoh Co Ltd Information processor, electronic timetable display method, program and recording medium

Also Published As

Publication number Publication date
JP2015184815A (en) 2015-10-22

Similar Documents

Publication Publication Date Title
CN109543501B (en) Image processing apparatus, image processing method, and storage medium
US10984233B2 (en) Image processing apparatus, control method, and non-transitory storage medium that obtain text data for an image
JP4251629B2 (en) Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium
JP5059545B2 (en) Image processing apparatus and image processing method
JPH113430A (en) Method and device for associating input image with reference image, and storage medium storing program realizing the method
US20060008113A1 (en) Image processing system and image processing method
JPS61267177A (en) Retrieving system for document picture information
JP6148193B2 (en) Form definition creation device, form definition creation method, and program
US20090265605A1 (en) Fixed-form information management system, method for managing fixed-form information, and computer readable medium
JP5623574B2 (en) Form identification device and form identification method
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2012098984A (en) Business form data correction method and business form data correction program
JP4982587B2 (en) Data entry system and data entry method
JP2014006758A (en) Preserved document delivery management system and preserved document delivery management method
JP6931168B2 (en) Information processing device, control method, program
JP6700705B2 (en) Distribution system, information processing method, and program
JP6947971B2 (en) Information processing device, control method, program
JP2018055256A (en) Information processing apparatus, information processing method, and program
US11163992B2 (en) Information processing apparatus and non-transitory computer readable medium
WO2016170690A1 (en) Input control program, input control device, input control method, character correction program, character correction device, and character correction method
WO2020044537A1 (en) Image comparison device, image comparison method, and program
JP2020181405A (en) Estimation work support system and estimation work support program
JP2015156166A (en) Map correction method and map correction device
JP2020047138A (en) Information processing apparatus
JP4221960B2 (en) Form identification device and identification method thereof

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20151005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170518

R150 Certificate of patent or registration of utility model

Ref document number: 6148193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150