JP7211157B2 - Information processing device, association method and association program - Google Patents

Information processing device, association method and association program Download PDF

Info

Publication number
JP7211157B2
JP7211157B2 JP2019034980A JP2019034980A JP7211157B2 JP 7211157 B2 JP7211157 B2 JP 7211157B2 JP 2019034980 A JP2019034980 A JP 2019034980A JP 2019034980 A JP2019034980 A JP 2019034980A JP 7211157 B2 JP7211157 B2 JP 7211157B2
Authority
JP
Japan
Prior art keywords
item
column
item name
columns
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019034980A
Other languages
Japanese (ja)
Other versions
JP2020140410A (en
Inventor
郁子 高木
志朗 小笠原
幸嗣 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019034980A priority Critical patent/JP7211157B2/en
Priority to PCT/JP2020/005631 priority patent/WO2020175163A1/en
Priority to US17/433,718 priority patent/US20220165077A1/en
Priority to EP20763375.1A priority patent/EP3910546A4/en
Priority to CN202080016620.8A priority patent/CN113508393A/en
Publication of JP2020140410A publication Critical patent/JP2020140410A/en
Application granted granted Critical
Publication of JP7211157B2 publication Critical patent/JP7211157B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Input (AREA)

Description

本発明は、情報処理装置、関連付け方法および関連付けプログラムに関する。 The present invention relates to an information processing device, an association method, and an association program.

業務において、電子ファイルまたは紙で作成された帳票が様々なシーンで用いられている。ここで帳票とは、電子ファイルまたは紙で作成されたドキュメントやシステム画面のなかでも、複数の項目について、それぞれ、その項目の名前(項目名)と値(項目値)が記載され、かつその関係性が2次元平面上の配置によって表現されているものをいう。 In business, electronic files or paper forms are used in various scenes. Here, a form is a document or system screen created in electronic files or on paper. It means that the nature is expressed by arrangement on a two-dimensional plane.

このような帳票は、記載内容の多くが同じであっても帳票の様式を定める組織によって様式が少しずつ異なることが多い。また、業務運用の過程で変更が加えられることも多い。例えば、従来の技術として、帳票の様式を定めた組織の違いや、運用中の改定等により、レイアウトが異なっていても、帳票上に記載された自動的に処理したい項目値の位置を正しく特定し、データを抽出できるようにするために、欄の種別(欄内の記載内容が項目名なのか、項目値なのか)を判別するための情報を予め与えることで、欄が項目名であるかどうかを判別し、その上で、項目名欄と項目値欄の対応関係を認識することで、指定された自動処理対象項目の項目名に対応する項目値欄を、帳票の欄の中から特定できるようにする方法がある。 Such forms often have slightly different formats depending on the organization that defines the format of the forms, even if most of the descriptions are the same. In addition, changes are often made in the process of business operation. For example, as a conventional technology, even if the layout is different due to differences in the organization that defined the format of the form, revisions during operation, etc., the position of the item value written on the form that you want to automatically process can be specified correctly. However, in order to be able to extract data, information for determining the type of column (whether the description in the column is the item name or the item value) is given in advance, so that the column is the item name. Then, by recognizing the correspondence between the item name column and the item value column, the item value column corresponding to the item name of the specified automatic processing item is selected from the form columns. There are ways to make it identifiable.

特開2018-10489号公報JP 2018-10489 A

しかしながら、従来の手法では、関連付けた結果が欄の配置変更に対応できない場合があるという課題があった。例えば、従来技術は、項目名が縦と横の両方に配置されている場合に縦と横が入れ替わった場合や、同一の項目値に関連付けられる複数の項目名間の親子関係の順序性が変わった場合に、項目値欄を特定できないという課題あった。 However, in the conventional method, there was a problem that the result of association may not correspond to the change in arrangement of columns. For example, in the conventional technology, when item names are arranged both vertically and horizontally, the vertical and horizontal directions are reversed, and the order of parent-child relationships between multiple item names associated with the same item value is changed. In this case, there was a problem that the item value column could not be specified.

上述した課題を解決し、目的を達成するために、本発明の情報処理装置は、所定の帳票における、所望の項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録部と、前記登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄を関連付け、所望の項目値欄を特定する求解部とを有することを特徴とする。 In order to solve the above-described problems and achieve the object, an information processing apparatus of the present invention registers a set of item names associated with item name columns associated with desired item value columns in a predetermined form. and a solution obtaining unit that associates the item name field and the item value field included in the form to be processed based on the set of item names registered by the registration part, and specifies the desired item value field. It is characterized by

本発明によれば、帳票の欄の配置に変更があった場合であっても、帳票に含まれる項目名欄と項目値欄とを関連付け、所望の項目値欄を特定することができるという効果を奏する。 According to the present invention, even if there is a change in the arrangement of the fields in the form, it is possible to associate the item name field and the item value field included in the form and specify the desired item value field. play.

図1は、第1の実施形態に係る情報処理装置の構成例を示すブロック図である。FIG. 1 is a block diagram showing a configuration example of an information processing apparatus according to the first embodiment. 図2は、第1の実施形態に係る情報処理装置における帳票処理ツールの論理構成を示すブロック図である。FIG. 2 is a block diagram showing the logical configuration of the form processing tool in the information processing apparatus according to the first embodiment. 図3は、相対配置パターンについて説明する図である。FIG. 3 is a diagram for explaining relative arrangement patterns. 図4は、記載内容・位置データの一例を示す図である。FIG. 4 is a diagram showing an example of description content/position data. 図5は、欄種別データの一例を示す図である。FIG. 5 is a diagram showing an example of column type data. 図6は、票を分割する処理を説明する図である。FIG. 6 is a diagram for explaining the process of dividing votes. 図7は、相対配置パターンのデータ例を示す図である。FIG. 7 is a diagram showing an example of relative arrangement pattern data. 図8は、許容される/されない相対配置パターンの一例を示す図である。FIG. 8 is a diagram showing an example of permissible/unacceptable relative arrangement patterns. 図9は、関連付け許容情報の一例を示す図である。FIG. 9 is a diagram showing an example of association permission information. 図10は、項目値欄基準での相対配置の判定結果と、項目名欄基準での相対配置の判定結果の両方を総合的に判断する処理例を説明する図である。FIG. 10 is a diagram illustrating an example of processing for comprehensively determining both the relative placement determination result based on the item value column and the relative placement determination result based on the item name column. 図11は、項目値欄基準での相対配置の判定結果と、項目名欄基準での相対配置の判定結果の両方を総合的に判断する処理例を説明する図である。FIG. 11 is a diagram illustrating an example of processing for comprehensively determining both the relative placement determination result based on the item value column and the relative placement determination result based on the item name column. 図12は、相対配置パターンを生成する処理例を説明する図である。FIG. 12 is a diagram illustrating an example of processing for generating relative arrangement patterns. 図13は、相対配置パターンを生成する処理例を説明する図である。FIG. 13 is a diagram illustrating an example of processing for generating relative arrangement patterns. 図14は、制約条件と評価関数を数式で表現する際に使用する記号について説明するための図である。FIG. 14 is a diagram for explaining symbols used when expressing constraints and evaluation functions in formulas. 図15は、様式登録時における制約条件の一例を示す図である。FIG. 15 is a diagram showing an example of constraints at the time of form registration. 図16は、様式登録時における評価関数の一例について説明する図である。FIG. 16 is a diagram explaining an example of an evaluation function at the time of form registration. 図17は、登録済み様式利用時における制約条件について説明する図である。FIG. 17 is a diagram for explaining constraints when using a registered form. 図18は、登録済み様式利用時における評価関数の一例を示す図である。FIG. 18 is a diagram showing an example of an evaluation function when using a registered form. 図19は、第1の実施形態に係る情報処理装置による求解例を示す図である。FIG. 19 is a diagram illustrating an example of solution finding by the information processing apparatus according to the first embodiment. 図20は、項目名欄と項目値欄の関連情報を示す図である。FIG. 20 is a diagram showing related information between the item name column and the item value column. 図21Aは、第1の実施形態に係る情報処理装置における全体的な処理の流れの一例を示すフローチャートである。FIG. 21A is a flowchart showing an example of the overall processing flow in the information processing apparatus according to the first embodiment; 図21Bは、第1の実施形態に係る情報処理装置における全体的な処理の流れの一例を示すフローチャートである。21B is a flowchart illustrating an example of the overall processing flow in the information processing apparatus according to the first embodiment; FIG. 図22は、第1の実施形態に係る情報処理装置の許容相対配置パターン生成部における処理の流れの一例を示すフローチャートである。22 is a flowchart illustrating an example of the flow of processing in the allowable relative arrangement pattern generation unit of the information processing apparatus according to the first embodiment; FIG. 図23は、第1の実施形態に係る情報処理装置の記載内容・位置取得部における処理の流れの一例を示すフローチャートである。23 is a flowchart illustrating an example of the flow of processing in the description content/position acquisition unit of the information processing apparatus according to the first embodiment; FIG. 図24は、第1の実施形態に係る情報処理装置の記載内容・位置取得部における処理の流れの一例を示すフローチャートである。24 is a flowchart illustrating an example of the flow of processing in the description content/position acquisition unit of the information processing apparatus according to the first embodiment; FIG. 図25は、第1の実施形態に係る情報処理装置の記載内容・位置取得部における処理の流れの一例を示すフローチャートである。25 is a flowchart illustrating an example of the flow of processing in the description content/position acquisition unit of the information processing apparatus according to the first embodiment; FIG. 図26は、特定プログラムを実行するコンピュータを示す図である。FIG. 26 is a diagram showing a computer executing a specific program.

以下に、本願に係る情報処理装置、関連付け方法および関連付けプログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本願に係る情報処理装置、関連付け方法および関連付けプログラムが限定されるものではない。 Embodiments of an information processing apparatus, an association method, and an association program according to the present application will be described below in detail with reference to the drawings. Note that the information processing apparatus, the association method, and the association program according to the present application are not limited by this embodiment.

[第1の実施形態]
以下の実施の形態では、第1の実施形態に係る情報処理装置10の構成、帳票処理ツール16の論理構成、情報処理装置10の処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
[First Embodiment]
In the following embodiments, the configuration of the information processing apparatus 10 according to the first embodiment, the logical configuration of the form processing tool 16, and the processing flow of the information processing apparatus 10 will be described in order. Explain the effect.

[情報処理装置の構成]
まず、図1を用いて、本実施形態の情報処理装置10を含むシステムの構成例を説明する。図1は、第1の実施形態に係る情報処理装置の構成例を示すブロック図である。なお、図1に示す構成は一例にすぎず、具体的な構成は特に限定されない。
[Configuration of information processing device]
First, with reference to FIG. 1, a configuration example of a system including an information processing apparatus 10 of this embodiment will be described. FIG. 1 is a block diagram showing a configuration example of an information processing apparatus according to the first embodiment. Note that the configuration shown in FIG. 1 is merely an example, and the specific configuration is not particularly limited.

情報処理装置10は、PC(Personal Computer)やスマートフォン等の装置であって、例えば、帳票の記載内容を機械的に処理する。ここで、帳票とは、例えば、アプリケーションで作成された電子データ、PDFファイル、システム画面の構造データ、画像データ(例えば、電子ファイルやシステム画面を画像データに変換したもの、紙をスキャンして電子化したもの)が対象である。 The information processing device 10 is a device such as a PC (Personal Computer) or a smart phone, and mechanically processes, for example, the contents of a form. Here, forms include, for example, electronic data created by applications, PDF files, structure data of system screens, image data (for example, electronic files and system screens converted into image data, scanned paper and converted) are targeted.

また、情報処理装置10は、帳票の記載内容を機械的に処理するのに先立ち、許容される相対配置パターンおよび許容されない相対配置パターン(以下、「許容される/されない相対配置パターン」と記載する)を登録する処理を行う。情報処理装置10は、帳票の様式登録の際、および登録済みの様式情報を利用する際は、登録した許容される/されない相対配置パターンを用いて、帳票に含まれる項目名欄と項目値欄との関連付けの可能性を判定する。なお、帳票の欄は矩形でなくてもよく、単純多角形であればよいものとする。また、帳票の欄は罫線で囲われることもあれば、囲われていないこともある。このため、罫線で囲われていない場合には、オブジェクト取得等で取得した矩形を欄として扱うよういしてもよい。 In addition, prior to mechanically processing the description content of the form, the information processing apparatus 10 sets the allowable relative arrangement pattern and the unacceptable relative arrangement pattern (hereinafter referred to as "allowed/unacceptable relative arrangement pattern"). ) is registered. When registering the form of the form and when using the registered form information, the information processing apparatus 10 uses the registered permitted/unacceptable relative arrangement pattern to set the item name column and the item value column included in the form. determine the possibility of association with It should be noted that the columns of the form need not be rectangular, and may be simple polygonal. Also, the columns of the form may or may not be surrounded by ruled lines. Therefore, when not surrounded by ruled lines, a rectangle acquired by object acquisition or the like may be treated as a column.

ここで、相対配置パターンについて、図3を用いて説明する。例えば、帳票における欄iの欄jに対する相対配置パターンとは、図3のように、平面を、欄jに外接する最小矩形を中心として、その左上、上、右上、左、右、左下、下、右下、同位の9個の領域に分けた時(以下、これらの領域を、「欄jを中心とする領域群」と呼ぶ)、欄iがどの領域に重なりをもつかを表したものである。欄iが広がる領域は、単一の場合もあるし、複数になる場合もある。ただし、欄は、単純多角形であるため、欄iの広がる領域が複数になる場合には、それらの領域同士は、領域の境界となる辺のうち少なくとも1個以上を共有している。 Here, relative arrangement patterns will be described with reference to FIG. For example, the relative arrangement pattern of column i with respect to column j in a form is, as shown in FIG. , lower right, when divided into 9 regions of the same order (hereinafter, these regions are referred to as “region group centered on column j”), which region overlaps with column i. is. The area over which column i extends may be single or plural. However, since the column is a simple polygon, when the column i extends into a plurality of regions, those regions share at least one or more of the borders of the regions.

許容される/されない相対配置パターンについて、例えば、日本国内で用いられる帳票においては、項目名欄iが、項目値欄jの項目名欄であるならば、項目名欄iは、項目値欄jを中心とする領域群のうち、少なくとも左、上のどちらかの領域と重なりを持つ(左、上以外の領域と重なりを持つかどうかは問わない)か、あるいは、同位の領域とのみ重なりを持つことを、仮定できる。言い換えれば、下記(1)~(3)の領域とのみ、重なりをもつ項目名欄iは、項目値欄jの項目名欄とはならない。
・(1)項目値欄jの左上の領域
・(2)項目値欄jの右上、右、右下、下、左下の領域、またはこれらのいくつか、あるいはすべてを結合した領域
・(3)上記(1)、(2)領域と、項目値欄jの同位の領域を結合した領域
Regarding permissible/impossible relative placement patterns, for example, in a form used in Japan, if item name column i is the item name column of item value column j, item name column i is the same as item value column j. In the group of regions centered on , overlap with at least either the region on the left or the top (regardless of whether or not it overlaps with regions other than the left and the top), or overlap only with the region at the same position can be assumed to have In other words, the item name column i, which overlaps only with the following areas (1) to (3), does not become the item name column of the item value column j.
(1) Upper left area of item value column j (2) Upper right, right, lower right, lower, lower left area of item value column j, or some or all of these combined areas (3) An area obtained by combining the above (1) and (2) areas and the equivalent area of the item value column j

許容される/されない相対配置パターンについて、例えば、日本国内で用いられる帳票においては、項目値欄jが、項目名欄iの項目値欄であるならば、項目値欄jは、項目名欄iを中心とする領域群のうち、少なくとも右、下のどちらかの領域と重なりを持つ(右、下以外の領域と重なりを持つかどうかは問わない)か、あるいは、同位の領域とのみ重なりを持つことを、仮定できる。言い換えれば、下記(1)~(3)の領域とのみ、重なりをもつ項目値欄jは、項目名欄iの項目値欄とはならない。
・(1)項目名欄iの右下の領域
・(2)項目名欄iの左下、左、左上、上、右上の領域、またはこれらを結合した領域
・(3)上記(1)、(2)の領域と、項目値欄iの同位の領域を結合した領域
Regarding permissible/unacceptable relative arrangement patterns, for example, in a form used in Japan, if the item value column j is the item value column of the item name column i, the item value column j becomes the item name column i Of the regions centered on , overlap at least either the right or bottom region (whether or not it overlaps with regions other than the right and bottom regions), or overlap only with the region at the same position can be assumed to have In other words, the item value column j that overlaps only with the following areas (1) to (3) does not become the item value column of the item name column i.
(1) Lower right area of item name column i (2) Lower left, left, upper left, upper, upper right area of item name column i, or an area combining these (3) Above (1), ( The area obtained by combining the area of 2) and the equivalent area of the item value column i

ここでは、許容される相対配置パターン、または許容されない配置パターンを、具体的に列挙することで指定しているが、「領域群のうち、○○領域と××領域の少なくともいずれかと重なりを持てば、許容される。」という許容条件や、非許容条件を表す論理式等により、指定してもよい。 Here, allowable relative arrangement patterns and unacceptable arrangement patterns are specified by specifically listing them. For example, it is allowed.”, or a logical expression representing an unacceptable condition.

以上は、任意の項目名欄と項目値欄に関する「汎用モデル」である。特定の様式における、特定の項目名をもつ項目名欄と項目値欄について、これとは異なる仮定が必要な場合には、「項目名個別ルール」として、その項目名欄と項目値欄の相対配置パターンについて、許容できるもの、または許容できないものを決めておくようにしてもよい。 The above is a "general model" for arbitrary item name columns and item value columns. Regarding the item name column and item value column with a specific item name in a specific format, if a different assumption is required, as an "item name individual rule" Regarding the arrangement pattern, it is also possible to determine what is permissible and what is not permissible.

情報処理装置10は、操作入力部11a、帳票入力部11b、表示部12、OS(Operating System)13、記憶部14、エディタ15および帳票処理ツール16を有する。なお、これらの構成要素が同一装置上にある場合に限定されず、複数の装置に分散して配置されてもよい。 The information processing apparatus 10 has an operation input section 11 a , a form input section 11 b , a display section 12 , an OS (Operating System) 13 , a storage section 14 , an editor 15 and a form processing tool 16 . Note that these components are not limited to being on the same device, and may be distributed and arranged in a plurality of devices.

操作入力部11aは、帳票の様式登録、機械的な処理などの実行命令や、項目名欄と項目値欄の関連情報の修正や編集などツールに対する操作を入力するものであり、キーボードやマウス、タッチパネルなどを備えて構成される。帳票入力部11bは、帳票のデータなどを入力するものであり、カメラ、スキャナなどを備えて構成される。また、表示部12は、各種処理結果を表示するものであり、ディスプレイやタッチパネル、スピーカなどを備えて構成される。 The operation input unit 11a is for inputting operations to tools such as registration of form of forms, execution commands for mechanical processing, and modification and editing of related information in item name columns and item value columns. It is configured with a touch panel and the like. The form input unit 11b is for inputting form data and the like, and includes a camera, a scanner, and the like. The display unit 12 displays various processing results, and includes a display, a touch panel, a speaker, and the like.

また、情報処理装置10本体は、OS13が実行され、OS13の処理にともない各種パラメータ等を編集するためのエディタ15や帳票を処理するための帳票処理ツール16が起動される。 In addition, the main body of the information processing apparatus 10 executes the OS 13, and along with the processing of the OS 13, the editor 15 for editing various parameters and the like and the form processing tool 16 for processing forms are activated.

記憶部14は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスク等の記憶装置である。記憶部14は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)等のデータを書き換え可能な半導体メモリであってもよい。記憶部14は、例えば、後述する欄の種別の判別情報を記憶する。 The storage unit 14 is, for example, a storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or an optical disc. The storage unit 14 may be a rewritable semiconductor memory such as a RAM (Random Access Memory), a flash memory, or an NVSRAM (Non Volatile Static Random Access Memory). The storage unit 14 stores, for example, discrimination information for types of columns described later.

次に、図2の例を用いて、帳票処理ツール16の論理構成について説明する。図2は、第1の実施形態に係る情報処理装置における帳票処理ツールの論理構成を示すブロック図である。図2に例示するように、帳票処理ツール16は、記載内容・位置取得部161、欄の種別判別部162、票分割部163、関連付け許容判定部164、評価関数生成部165、制約条件付与部166、求解部167、登録部168a、修正部168bおよび許容相対配置パターン生成部169を有する。 Next, the logical configuration of the form processing tool 16 will be described using the example of FIG. FIG. 2 is a block diagram showing the logical configuration of the form processing tool in the information processing apparatus according to the first embodiment. As illustrated in FIG. 2, the form processing tool 16 includes a description content/position acquisition unit 161, a column type determination unit 162, a form division unit 163, an association permission determination unit 164, an evaluation function generation unit 165, and a constraint condition provision unit. 166, a solution obtaining unit 167, a registration unit 168a, a correction unit 168b, and an allowable relative arrangement pattern generation unit 169.

記載内容・位置取得部161は、帳票のデータを受け付け、帳票における欄の構成領域と欄に含まれる文字列を取得する。そして、記載内容・位置取得部161は、取得した各帳票中の各欄の文字列と各欄の構成領域を示す記載内容・位置データ170aを作業データ蓄積部170に格納する。ここで、記載内容・位置データ170aについて図4を用いて説明する。図4に例示するように、記載内容・位置データ170aは、欄を識別する「欄ID」と、欄に含まれる「文字列」と、文字列を構成する「文字の種類」と、「欄の構成領域」とが対応付けられている。欄の構成領域は、例えば、ベクターデータのように、欄の輪郭線、欄の頂点集合に関する情報であってもよいし、ラスターデータのように、帳票全体を行と列の格子状に並んだセルに分割して、欄がどのセルを含むかどうかの情報であってもよい。 The description content/position acquisition unit 161 receives the data of the form and acquires the constituent regions of the columns in the form and the character strings included in the columns. Then, the described content/position acquisition unit 161 stores, in the work data storage unit 170, the description content/position data 170a indicating the character string of each column in each form and the configuration area of each column. Here, description content/position data 170a will be described with reference to FIG. As illustrated in FIG. 4, the description content/position data 170a includes a "column ID" that identifies a column, a "character string" that is included in the column, a "character type" that constitutes the character string, and a "column 's configuration area' is associated with. The configuration area of a column may be, for example, information related to the outline of the column and the set of vertices of the column as in vector data, or the entire form arranged in a grid of rows and columns as in raster data. It may be divided into cells and may be information about which cell the column contains.

欄の種別判別部162は、帳票の各欄の種別を判別し、判別結果を欄種別データ170bとして作業データ蓄積部170に格納する。なお、帳票の各欄の種別を判別する方法はどのような方法であってもよい。また、欄の種別判別部162は、既知の帳票については、予め設定された欄の種別を判別するための情報を参照して、帳票の各欄の種別を判別するようにしてもよい。また、例えば、欄の種別判別部162は、レイアウトが同一の複数の帳票を取得し、各帳票における同一位置の各欄の記載内容を比較し、各帳票における同一位置の欄の記載内容が同一である場合には、当該欄の種別を項目名と判別し、異なる欄がある場合には、当該欄の種別を項目値と判別するようにしてもよい。 The column type determination unit 162 determines the type of each column of the form, and stores the determination result in the work data storage unit 170 as column type data 170b. Any method may be used to determine the type of each column of the form. For a known form, the column type determination unit 162 may determine the type of each column of the form by referring to preset information for determining the type of the column. Further, for example, the column type determination unit 162 acquires a plurality of forms having the same layout, compares the description contents of each column at the same position in each form, and determines whether the description contents of the column at the same position in each form are the same. , the type of the column may be determined as the item name, and if there is a different column, the type of the column may be determined as the item value.

ここで、欄種別データ170bについて図5を用いて説明する。図5に例示するように、欄種別データ170bは、欄を識別する「ID」と欄の種別を示す「種別」とが対応付けられている。図5の例では、種別が「TRUE」である場合には、欄が「項目名」であることを意味し、種別が「FALSE」である場合には、欄が「項目値」であることを意味する。 Here, the column type data 170b will be explained using FIG. As exemplified in FIG. 5, the column type data 170b is associated with "ID" that identifies the column and "type" that indicates the type of the column. In the example of FIG. 5, if the type is "TRUE", it means that the field is "item name", and if the type is "FALSE", it means that the field is "item value". means

票分割部163は、項目名欄と項目値欄の関連付けの効率化のために、票を分割する。票分割部163は、例えば、図6に例示するように、罫線で囲われている領域と、囲われていない領域で分割し、各領域における票をそれぞれ一つの票として扱う。そして、票分割部163は、記載内容・位置データ170aのデータを票ごとに分けて票別記載内容・位置データ170cとして作業データ蓄積部170に格納する。なお、票分割部163による処理は省略してもよく、票を分割しない場合には、帳票全体を1つの票として扱い、以後の処理を行う。以降では、特に断りのない限り、分割した場合には分割して得られる各票を、分割しない場合には帳票全体を、単に「帳票」として記載し、区別しない。 The form dividing unit 163 divides the form in order to efficiently associate the item name column and the item value column. For example, as shown in FIG. 6, the vote dividing unit 163 divides the area into areas enclosed by ruled lines and areas not enclosed by ruled lines, and treats the votes in each area as one vote. Then, the form dividing unit 163 divides the data of the description content/position data 170a for each form and stores them in the work data accumulation unit 170 as description content/position data 170c for each form. Note that the processing by the form dividing unit 163 may be omitted, and when the form is not divided, the entire form is treated as one form and the subsequent processing is performed. Hereinafter, unless otherwise specified, each form obtained by division will be simply referred to as a "form" if not divided, and the entire form will not be distinguished.

関連付け許容判定部164は、処理対象の帳票中の各欄を基準にして他の欄の存在領域の分布パターンである相対配置パターンをそれぞれ求め、該相対配置パターンと、予め設定された「許容される/されない相対配置パターン」のうちのいずれか一つまたは両方と比較し、処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定する。つまり、関連付け許容判定部164は、「許容される/されない相対配置パターン」に基づき、各項目値欄と項目名欄とが関連付く可能性があるかどうかを判定する。 The association admissibility determination unit 164 obtains a relative arrangement pattern, which is a distribution pattern of the existence areas of other columns, based on each column in the form to be processed, and determines the relative arrangement pattern and the preset "permissible "relative arrangement pattern that is/is not provided", and determines whether or not there is a possibility of association between the item name column and the item value column in the form to be processed. That is, the association admissibility determination unit 164 determines whether or not there is a possibility that each item value column and item name column are associated based on the "allowed/not allowed relative arrangement pattern".

具体的には、まず、関連付け許容判定部164は、処理対象の帳票中の各欄を基準にして他の欄の存在領域の分布パターンである相対配置パターンを求め、「相対配置パターン」170dとして作業データ蓄積部170に格納する。ここで、図7の例を用いて、相対配置パターンのデータ例について説明する。図7に例示するように、相対配置パターンは、項目名を識別する「項目名欄ID」と、項目値を識別する「項目値欄ID」と、項目名と項目値のいずれを基準とするかを示す「基準」と、相対配置パターンを識別する「相対配置パターンID」とが対応付けられている。 Specifically, first, the association admissibility determination unit 164 obtains a relative arrangement pattern, which is the distribution pattern of the existence areas of other columns, based on each column in the form to be processed, and obtains the relative arrangement pattern as a "relative arrangement pattern" 170d. Stored in the work data storage unit 170 . Here, an example of relative arrangement pattern data will be described using the example of FIG. As exemplified in FIG. 7, the relative arrangement pattern is based on the "item name column ID" that identifies the item name, the "item value column ID" that identifies the item value, and any of the item name and the item value. A "reference" indicating whether or not is associated with a "relative arrangement pattern ID" for identifying the relative arrangement pattern.

そして、関連付け許容判定部164は、相対配置パターン保持部171に記憶される許容される/されない相対配置パターン171aを参照し、各欄の相対配置パターンが各項目値欄と項目名欄とが関連付く可能性があるかどうかを判定する。具体的には、項目名欄と項目値欄の各組合せについて、項目名欄を基準とする項目値欄の相対配置パターンが許容されるかどうか、および項目値欄を基準とする項目名欄の相対配置パターンが許容されるかどうかを、許容される/されない相対配置パターン171aを参照して判定し、どちらを基準とした場合にも許容される場合には、関連付く可能性があると判定し、そうでない場合には、関連付く可能性がないと判定する。ここで、図8の例を用いて、許容される/されない相対配置パターンのデータ例について説明する。許容される/されない相対配置パターン171aは、相対配置パターンIDを示す「ID」と、項目名と項目値のいずれを基準とするかを示す「基準」と、左上、上、右上、左、同位、右、左下、下、右下のそれぞれに配置されているかどうか(1/0)を上記の順に2進数で表現した「相対配置パターン」と、許容されるか否かを示す「許容可否」とが対応付けられている。 Then, the association admissibility determination unit 164 refers to the permitted/unacceptable relative arrangement patterns 171a stored in the relative arrangement pattern holding unit 171, and determines whether the relative arrangement pattern of each column is associated with each item value column and the item name column. Determine if it is possible. Specifically, for each combination of the item name field and the item value field, whether or not the relative arrangement pattern of the item value field with the item name field as the reference is allowed, and whether the item name field with the item value field as the reference Whether or not the relative arrangement pattern is allowed is determined by referring to the allowed/unacceptable relative arrangement pattern 171a, and if both are allowed based on the reference, it is determined that there is a possibility of association. If not, it is determined that there is no possibility of association. Here, data examples of allowable/unacceptable relative arrangement patterns will be described using the example of FIG. The allowed/unacceptable relative arrangement pattern 171a includes "ID" indicating the relative arrangement pattern ID, "reference" indicating whether the item name or the item value is used as the reference, and "upper left", "upper right", "left", and "coordinate". , right, lower left, lower, lower right (1/0) expressed in binary numbers in the above order, and "allowability" indicating whether or not it is allowed. are associated with.

図7および図8の例を挙げて具体例に説明すると、例えば、関連付け許容判定部164は、図7に例示する相対配置パターンの1行目の、項目名欄ID「1」、項目値欄ID「3」、基準「項目名」について、相対配置パターンIDが「8」であるため、図8の許容される/されない相対配置パターン171aのID「8」に対応する許容可否を参照する。図8の例では、ID「8」に対応する許容可否が「○」であるため、関連付け許容判定部164は、許容されるものと判定する。また、関連付け許容判定部164は、項目名欄ID「1」、項目値欄ID「3」、基準「項目値」について、相対配置パターンIDが「548」であるため、許容される/されない相対配置パターン171aのID「548」に対応する許容可否を参照する。ここで、ID「548」に対応する許容可否も「○」であるため、関連付け許容判定部164は、項目名欄ID「1」の項目名欄と項目値欄ID「3」の項目値欄とは関連付く可能性があると判定し、判定結果を関連付け許容情報170eとして作業データ蓄積部170に格納する。また、もし、ID「548」に対応する許容可否が「×」であれば、関連付け許容判定部164は、項目名欄ID「1」の項目名欄と項目値欄ID「3」の項目値欄とは関連付く可能性がないと判定し、判定結果を関連付け許容情報170eとして作業データ蓄積部170に格納する。 7 and 8, for example, the association admissibility determination unit 164 determines the item name column ID "1" and the item value column in the first row of the relative arrangement pattern illustrated in FIG. Regarding the ID "3" and the reference "item name", the relative arrangement pattern ID is "8". In the example of FIG. 8, since the permissibility corresponding to ID "8" is "O", the association permissibility determining unit 164 determines that it is permissible. In addition, the association permission determination unit 164 determines that the item name column ID “1”, the item value column ID “3”, and the reference “item value” have relative layout pattern ID “548”, so that the relative layout pattern ID is “548”. Refer to the admissibility corresponding to the ID "548" of the layout pattern 171a. Here, since the permissibility corresponding to the ID “548” is also “O”, the association permissibility determination unit 164 determines the item name column of the item name column ID “1” and the item value column of the item value column ID “3”. and stores the determination result in the work data accumulation unit 170 as the association permission information 170e. Further, if the allowability corresponding to the ID “548” is “x”, the association allowability determination unit 164 determines the item name column of the item name column ID “1” and the item value of the item value column ID “3”. It is determined that there is no possibility of association with the column, and the determination result is stored in the work data accumulation unit 170 as association permission information 170e.

ここで、図9の例を用いて、関連付け許容情報のデータ例について説明する。関連付け許容情報170eは、図9に例示するように、「項目名欄ID」および「項目値欄ID」の組み合わせと許容可能かどうかを示す「許容可能」とが対応付けられている。関連付け許容情報170eにおける許容可能が「1」である場合には、対応する「項目名欄ID」および「項目値欄ID」の組み合わせが関連付く可能性があることを意味する。上記の例のように、関連付け許容判定部164は、項目名欄ID「1」の項目名欄と項目値欄ID「3」の項目値欄とは関連付く可能性があると判定した場合には、関連付け許容情報として、項目名欄ID「1」と項目値欄ID「3」と許容可能「1」とを対応付けて作業データ蓄積部170に格納する。 Here, a data example of the association permission information will be described using the example of FIG. 9 . As illustrated in FIG. 9, the association permission information 170e associates a combination of "item name column ID" and "item value column ID" with "permissible" indicating whether or not the combination is permissible. If the allowable in the association allowable information 170e is "1", it means that the corresponding combination of "item name column ID" and "item value column ID" may be associated. As in the above example, when the association admissibility determination unit 164 determines that there is a possibility of associating the item name column with the item name column ID "1" and the item value column with the item value column ID "3", associates the item name column ID "1", the item value column ID "3", and the allowable column "1" and stores them in the work data accumulation unit 170 as association permission information.

このように、関連付け許容判定部164は、欄の形状が矩形ではない場合であっても、項目値欄基準での相対配置の判定結果と、項目値名欄基準での相対配置の判定結果の両方を総合的に判断することにより、補完し合い、不要な対応関係の可能性を否定でき、誤って対応付けられる場合を減らすことが可能である。 In this way, even if the shape of the field is not rectangular, the association permission determination unit 164 can compare the relative placement determination result based on the item value field and the relative placement determination result based on the item value name field. By comprehensively judging both, it is possible to complement each other, deny the possibility of unnecessary correspondence, and reduce the possibility of erroneous correspondence.

ここで、図10および図11を用いて、項目値欄基準での相対配置の判定結果と、項目名欄基準での相対配置の判定結果の両方を総合的に判断する処理について説明する。図10および図11は、項目値欄基準での相対配置の判定結果と、項目名欄基準での相対配置の判定結果の両方を総合的に判断する処理例を説明する図である。 Here, a process for comprehensively determining both the determination result of the relative placement based on the item value column and the determination result of the relative placement based on the item name column will be described with reference to FIGS. 10 and 11. FIG. 10 and 11 are diagrams for explaining an example of processing for comprehensively determining both the relative placement determination result based on the item value column and the relative placement determination result based on the item name column.

例えば、図10に例示するように、関連付け許容判定部164は、項目値欄j基準で相対配置を判定すると、項目名欄iは「同位」の領域内にのみ存在しており、「左」「上」の領域には広がっていないものの、「同位」でよくわからないため、対応関係は否定できないものと判定する。一方、関連付け許容判定部164は、項目名欄i基準で相対配置を判定すると、項目値欄jは「左」「左上」「上」の領域内にのみ存在し、対応関係はあり得ないと判定する。このため、関連付け許容判定部164は、判定結果を総合すると、項目名欄iは、項目値欄jの項目名欄にはなりえないと判断する。 For example, as exemplified in FIG. 10 , when the association admissibility determination unit 164 determines the relative arrangement based on the item value column j, the item name column i exists only in the “same rank” area, and the “left” Although it does not extend to the "upper" area, it is not clearly understood as "coordinated", so it is determined that the correspondence cannot be denied. On the other hand, when the association admissibility determination unit 164 determines the relative arrangement based on the item name column i, the item value column j exists only in the areas of "left", "upper left", and "upper", and there is no corresponding relationship. judge. For this reason, the association permission determination unit 164 determines that the item name column i cannot be the item name column of the item value column j, when the determination results are combined.

また、例えば、図11に例示するように、関連付け許容判定部164は、項目値欄j基準で相対配置を判定すると、項目名欄iは「右」「右下」「下」の領域内にのみ存在し、対応関係はありえないと判定する。一方、関連付け許容判定部164は、項目名欄i基準で相対配置を判定すると、項目値欄jは「同位」の領域内にのみ存在し、「右」「下」の領域には広がっていないものの、「同位」でよくわからないため、対応関係は否定できないと判定する。このため、関連付け許容判定部164は、判定結果を総合すると、項目名欄iは、項目値欄jの項目名欄にはなりえないと判断する。 Further, for example, as illustrated in FIG. 11, when the association admissibility determination unit 164 determines the relative arrangement based on the item value column j, the item name column i is located within the regions "right", "lower right", and "bottom". It is determined that there is only one and that there is no corresponding relationship. On the other hand, when the association admissibility determination unit 164 determines the relative arrangement based on the item name column i, the item value column j exists only within the "same level" area and does not extend to the "right" and "bottom" areas. However, it is determined that the correspondence relationship cannot be denied because it is not clearly understood by "same rank". For this reason, the association permission determination unit 164 determines that the item name column i cannot be the item name column of the item value column j, when the determination results are combined.

ここで、上述した許容される/されない相対配置パターンを具体的に列挙し、そのそれぞれに対して許容される/されない、を指定しておく方法とは別の方法として、様々な様式の項目名欄と項目値欄の関連付けの事例から、相対配置パターンを取得して、それを基に許容する配置パターンを生成することも可能である。例えば、許容相対配置パターン生成部169は、任意の項目名欄と項目値欄が関連付くこと(または関連付かないこと)が既知のときに、その項目名欄と項目値欄の相対配置パターンがいずれかにより、許容する(または許容しない)相対配置パターンを生成する。 Here, as an alternative to the method of specifically enumerating the above-mentioned allowable/not allowable relative placement patterns and specifying allowable/not allowable for each of them, item names of various formats It is also possible to obtain a relative arrangement pattern from an example of association between a field and an item value field, and generate an allowable arrangement pattern based on it. For example, when it is known that an arbitrary item name column and an item value column are associated (or not associated), the allowable relative arrangement pattern generation unit 169 determines that the relative arrangement pattern of the item name column and the item value column is Either produces an acceptable (or unacceptable) relative placement pattern.

許容相対配置パターン生成部169は、所定の様式の帳票における項目名欄と項目値欄との関連付けから、相対配置パターンを取得して、取得した相対配置パターンを基に許容する相対配置パターンのデータを作成する。つまり、許容相対配置パターン生成部169では、項目名欄と項目値欄の関連付けに関する情報を用いて、許容される(あるいは、許容されない)相対配置パターンを生成する。なお、項目名欄と項目値欄の関連付け情報は、人手等で関連付けられた結果が、許容相対配置パターン生成部の入力として与えられるものとする。 The allowable relative arrangement pattern generation unit 169 acquires the relative arrangement pattern from the association between the item name column and the item value column in the form of the predetermined format, and generates allowable relative arrangement pattern data based on the acquired relative arrangement pattern. to create In other words, the permissible relative arrangement pattern generation unit 169 generates permissible (or not permissible) relative arrangement patterns using information relating to the association between the item name column and the item value column. It should be noted that the association information between the item name column and the item value column is given as an input to the permissible relative arrangement pattern generation unit as a result of manual association or the like.

ここで、図12および図13の例を用いて、相対配置パターンを生成する処理について説明する。図12および図13は、相対配置パターンを生成する処理例を説明する図である。例えば、図12に例示するように、許容相対配置パターン生成部169は、項目名欄iと項目値欄jとが関連付くことが既知である場合に、項目名欄iを基準とした相対配置パターン「000001000」を許容される相対配置パターンとして生成し、相対配置パターン保持部171に格納する。また許容相対配置パターン生成部169は、項目値欄jを基準とした相対配置パターン「100100100」を許容される相対配置パターンとして生成し、相対配置パターン保持部171に格納する。 Here, the processing for generating the relative arrangement pattern will be described using the examples of FIGS. 12 and 13. FIG. 12 and 13 are diagrams illustrating an example of processing for generating relative arrangement patterns. For example, as exemplified in FIG. 12, the permissible relative arrangement pattern generation unit 169 generates a relative arrangement based on the item name column i when it is known that the item name column i and the item value column j are related. A pattern “000001000” is generated as an allowable relative arrangement pattern and stored in the relative arrangement pattern holding unit 171 . The permissible relative arrangement pattern generation unit 169 also generates the relative arrangement pattern “100100100” based on the item value column j as the permissible relative arrangement pattern, and stores it in the relative arrangement pattern holding unit 171 .

また、図13に例示するように、許容相対配置パターン生成部169は、項目名欄iと項目値欄jとが関連付くことが既知である場合に、項目名欄iを基準とした相対配置パターン「000010000」を許容される相対配置パターンとして生成し、相対配置パターン保持部171に格納する。また許容相対配置パターン生成部169は、項目値欄jを基準とした相対配置パターン「110100100」を許容される相対配置パターンとして生成し、相対配置パターン保持部171に格納する。 Further, as illustrated in FIG. 13, the allowable relative arrangement pattern generation unit 169 generates a relative arrangement based on the item name column i when it is known that the item name column i and the item value column j are associated. A pattern “000010000” is generated as an allowable relative arrangement pattern and stored in the relative arrangement pattern holding unit 171 . The permissible relative arrangement pattern generation unit 169 also generates the relative arrangement pattern “110100100” based on the item value column j as the permissible relative arrangement pattern, and stores it in the relative arrangement pattern holding unit 171 .

また、関連付け許容判定部164は、登録済み様式情報利用時、すなわち、様式保持部172で保持されている様式情報を使って処理対象帳票中の項目値欄と項目名欄の関連付けを求める際に、予め設定された許容される分布パターンおよび許容されない分布パターンのうちのいずれか一つまたは両方を項目名別に定義する項目名個別ルールが様式情報として設定されている場合には、該項目名個別ルールに応じて、処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定するようにしてもよい。項目名個別ルールとして、例えば、項目名の文字列が「契約ID」の欄は右方向にある項目値欄と関連付くことや、項目名の文字列が「顧客タイプ」の欄は下方向にある項目値と関連付かないこと等が設定されているものとする。 Also, when using the registered form information, that is, when using the form information held in the form holding part 172 to determine the association between the item value column and the item name column in the form to be processed, the association permission determination unit 164 , and if an item name individual rule that defines one or both of a preset allowable distribution pattern and an unacceptable distribution pattern for each item name is set as format information, the item name individual Whether or not there is a possibility of association between the item name column and the item value column in the form to be processed may be determined according to a rule. As an item name individual rule, for example, the column with the item name character string "contract ID" should be associated with the item value column on the right side, or the column with the item name character string "customer type" should be associated with the column below It is assumed that it is set such that it is not associated with a certain item value.

評価関数生成部165は、評価関数で必要な、帳票に応じて決定される係数を求め、評価関数を生成し、適用する評価関数170fとして作業データ蓄積部170に格納する。評価関数は、各項目値欄に対して、項目名欄と項目値欄の関連の度合いを評価する観点を反映した評価項目で構成される。評価関数には、項目値欄と項目名欄の関連付けを求める際の評価項目として、項目値欄と項目名欄の配置上の近さ、欄の幅/高さの差あるいはその割合の小ささ、項目値欄と項目名欄の関連付けの少なさ、といった評価項目のうちのいずれかまたはすべてを用いる。また、登録済み様式情報利用時には、これらの評価項目に加え、様式登録時の帳票中に存在していた項目のうち、処理対象帳票中にも存在する項目の多さ、といった評価項目を用いる。 The evaluation function generation unit 165 obtains coefficients required for the evaluation function and determined according to the form, generates the evaluation function, and stores it in the work data accumulation unit 170 as the evaluation function 170f to be applied. The evaluation function is composed of evaluation items that reflect the viewpoint of evaluating the degree of association between the item name column and the item value column for each item value column. In the evaluation function, the closeness in arrangement of the item value column and the item name column, the difference in the width/height of the column, or the smallness of their ratio are used as the evaluation items when determining the association between the item value column and the item name column. , the lack of association between the item value column and the item name column, or any or all of the evaluation items. When using the registered form information, in addition to these evaluation items, an evaluation item such as the number of items existing in the form at the time of form registration that also exist in the form to be processed is used.

例えば、帳票は、項目名の情報から項目値の記載内容を理解できる媒体であることを前提とすると、可読性の観点から、項目名欄は項目値欄となるべく距離が近い位置に配置されている可能性が高い。従って、「項目名欄と項目値欄の距離が近いほうが、評価が高い」という、汎用的な評価項目を仮定できる。また、項目名欄と項目値欄の関連は、欄のサイズによっても表現されており、項目名欄の幅と項目値欄の幅が近い、つまり、帳票の縦方向または横方向に欄を射影した際に、重なる範囲が大きいほうが関連性が高い傾向があることから、汎用的な評価項目として「項目名欄の幅と項目値欄の幅の差が小さいほうが評価値が高い」を仮定できる。 For example, assuming that a form is a medium in which the contents of item values can be understood from the item name information, the item name column and the item value column are placed as close as possible from the viewpoint of readability. Probability is high. Therefore, it is possible to assume a general-purpose evaluation item such that "the closer the distance between the item name column and the item value column, the higher the evaluation". In addition, the relationship between the item name column and the item value column is also expressed by the size of the column. Since there is a tendency that the larger the overlapping range, the higher the relevance, it can be assumed that "the smaller the difference between the width of the item name column and the width of the item value column, the higher the evaluation value" as a general evaluation item. .

また、汎用的な、あるいは項目名個別ルールの許容される相対配置パターンについて、相対配置パターンごとに予め評価項目値を用意しておき、項目名欄と項目値欄の関連付けが未知の帳票の項目名欄と項目値欄の組合せに対し、それらの相対配置パターンに応じてその評価項目値を適用し、評価関数に含めてもよい。相対配置パターンごとに予め用意する評価項目値としては、例えば、項目名欄と項目値欄の関連付けが既知の帳票において、関連付けられる事例が多い相対配置パターンほど高い評価項目値とすることが考えられる。 In addition, for general-purpose or permissible relative placement patterns for item name individual rules, prepare evaluation item values for each relative placement pattern in advance, The evaluation item value may be applied to the combination of the first name column and the item value column according to their relative arrangement pattern and included in the evaluation function. As the evaluation item values prepared in advance for each relative arrangement pattern, for example, in a form in which the association between the item name column and the item value column is known, it is conceivable to set the evaluation item value higher for the relative arrangement pattern with more associated cases. .

また、登録済み様式情報利用時には、項目名欄に関連付けられる項目値欄の、相対配置パターンや欄内に記載されている文字の種類と、様式登録時の帳票におけるそれらとの一致度合いに関する評価項目を、評価関数に含めてもよい。 Also, when using registered form information, evaluation items related to the relative arrangement pattern of the item value column associated with the item name column, the type of characters written in the column, and the degree of matching with the form at the time of form registration may be included in the evaluation function.

あるいは、後述の制約条件を満たさない場合にペナルティとなる評価項目を含めてもよい。例えば、項目値欄が項目名欄と関連付かない場合も許容しつつも、なるべくそのような項目値欄が残らないように、「項目値欄に項目名欄が1個も割り当てられなければ評価が低い」という評価項目を評価関数に含めてもよい。 Alternatively, an evaluation item that becomes a penalty when the below-described constraint conditions are not satisfied may be included. For example, while allowing the case where the item value field is not associated with the item name field, it is possible to prevent such an item value field from remaining as much as possible. may be included in the evaluation function.

あるいは、評価関数生成部165は、登録済み様式情報利用時には、項目が追加された可能性のある場合、すなわち項目名欄、項目値欄が正しく判別できていない欄が含まれている可能性のある場合、各項目名欄に関連付けられる項目値欄の個数と、様式登録時の帳票におけるそれとの一致度合いに関する評価項目を、評価関数に含めてもよい。なお、この場合には、評価関数生成部165は、様式登録時の帳票において各項目名欄に関連付けられる項目値欄の個数を、様式保持部172で保持されている様式情報から算出する。 Alternatively, when using the registered form information, the evaluation function generation unit 165 may generate an item that may have been added. In some cases, the evaluation function may include an evaluation item regarding the number of item value columns associated with each item name column and the degree of matching with that in the form at the time of format registration. In this case, the evaluation function generation unit 165 calculates the number of item value columns associated with each item name column in the form at the time of format registration from the format information held in the format holding unit 172 .

評価関数生成部165は、項目値欄と項目名欄の関連付けを求める際の評価関数として、上述したような評価項目候補のうち、いずれか一つまたは複数を、予め指定しておいた重みにより重み付けし、関数として生成する。 The evaluation function generation unit 165 selects one or more of the above-described evaluation item candidates as an evaluation function when determining the association between the item value column and the item name column, with weights specified in advance. Weighted and generated as a function.

ここで、図14の例を用いて評価関数と制約条件を数式として表現する際に用いる記号について説明する。図14は、評価関数と制約条件を数式として表現する際に用いる記号について説明するための図である。図14では、「集合と要素」、「定数」、「変数」および「評価関数」についてそれぞれ記号の定義が記載されている。 Here, the symbols used when expressing the evaluation function and the constraint conditions as mathematical expressions will be described using the example of FIG. 14 . FIG. 14 is a diagram for explaining symbols used when expressing evaluation functions and constraints as mathematical expressions. In FIG. 14, definitions of symbols are described for "sets and elements", "constants", "variables" and "evaluation functions".

そして、ここで、図16、図18の例を用いて、評価関数の一例について説明する。図16は、様式登録時における評価関数の一例について説明する図である。図16の(1)式では、xijを変数として、評価値の総和が最小となるように解を求める。また、cijは、図16の(2)式により求められる。 Here, an example of the evaluation function will be described using the examples of FIGS. 16 and 18. FIG. FIG. 16 is a diagram explaining an example of an evaluation function at the time of form registration. In equation (1) of FIG. 16, a solution is obtained so that the total sum of evaluation values is minimized using x ij as a variable. Also, c ij is obtained by the equation (2) in FIG.

図18は、登録済み様式情報利用時の評価関数の一例について説明する図である。図18の(1)式、その中のcijは、図16と同じである。図18の(2)式は、様式情報から求められる様式登録時の帳票に含まれる項目名セットのうち、処理対象帳票中のいずれの項目値欄とも関連づかない項目名セットの少なさ、すなわち、様式登録時の帳票中に存在していた項目のうち、処理対象帳票中にも存在する項目の多さに関する評価項目を重み付けしたものである。 FIG. 18 is a diagram illustrating an example of an evaluation function when using registered form information. Equation (1) in FIG. 18 and c ij therein are the same as in FIG. Expression (2) in FIG. 18 indicates how few item name sets are not associated with any item value column in the form to be processed, among the item name sets included in the form at the time of form registration obtained from the form information. , are weighted evaluation items regarding the number of items that exist in the form to be processed among the items that exist in the form at the time of format registration.

制約条件付与部166は、所定の制約条件を付与し、適用する制約条件170gとして作業データ蓄積部に格納する。制約条件には、各項目値欄が関連付く項目名欄の組み合わせを仮定したときに、少なくとも満たすべき条件を定義する。なお、様式登録時と、登録済み様式情報利用時とでは、制約条件が異なるものとする。なお、以下に例示する制約条件は、一例であり、その他制約条件を追加で付与してもよい。例えば、一部の項目について、項目名欄と項目値欄が関連付けられること、関連付けられないことが与えられていれば、制約条件に追加で付与してもよい。 The constraint condition applying unit 166 gives a predetermined constraint condition and stores it in the work data storage unit as a constraint condition to be applied 170g. As the constraint condition, define at least a condition that must be satisfied when assuming a combination of item name columns associated with each item value column. It should be noted that the constraint conditions differ between when the form is registered and when the registered form information is used. In addition, the constraint conditions illustrated below are examples, and other constraint conditions may be added. For example, if it is given that the item name column and the item value column are associated or not associated with some items, it may be added to the constraint condition.

例えば、制約条件付与部166は、処理対象の帳票中の項目名欄と項目値欄とが判別できる、様式登録時であれば、制約条件「項目名欄と項目値欄が関連付けられるのは、関連付けが許容される相対配置パターンである場合に限られる」と、制約条件「各項目値欄は、少なくとも1個以上の項目名欄と関連付く」と、制約条件「文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個」と、制約条件「項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なる」とを付与する。 For example, the constraint condition provision unit 166 can distinguish between the item name column and the item value column in the form to be processed. Only if it is a relative arrangement pattern that allows association", the constraint condition "each item value field is associated with at least one or more item name fields", and the constraint condition "item name fields with the same character string is associated with the same item value column,” and the constraint condition “Item value columns have different sets of item names described in their associated item name columns. ” is given.

また、例えば、制約条件付与部166は、処理対象の帳票中の項目値欄の中に、欄の種別を判別できていない欄が含まれている可能性のある、登録済み様式情報利用時であれば、制約条件の付与に先立ち、まず、様式保持部172で保持している様式情報から、様式登録時の帳票の各項目値欄に対し、項目名セットを求める。ここで項目名セットとは、各項目値欄に関連付けられる項目名欄の文字列の集合のことをいう。次に、各項目名セットに対し、処理対象帳票中の項目名欄の中から、項目名セットに含まれる文字列をもつ項目名欄を選び、割り当てることにより、項目名欄セットを作成する。ここで項目名欄セットとは、項目名欄の集合のことをいう。その際、同じ文字列、つまり項目名をもつ項目名欄が処理対象帳票中に複数あり、複数通りの割り当て方が可能であれば、その割り当て方の場合の数だけ、項目名欄セットを列挙する。その上で、制約条件「項目名欄と項目値欄が関連付けられるのは、関連付けが許容される相対配置パターンである場合に限られる」と、制約条件「各項目名欄セットは最大1個の項目値欄と関連付く」と、制約条件「各項目値欄は、最大1個の項目名欄セットと関連付く」と、制約条件「同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個」とを付与する。また、登録済みの様式情報に含まれる項目のうち、処理対象として必須の項目が指定されている場合には、それら項目の各項目名セットについて、制約条件「同じ項目名セットから生成される項目名欄セットのうち、項目値欄に関連付くものはちょうど1個」をさらに付与する。 Also, for example, the constraint condition assigning unit 166 may include a column for which the column type cannot be determined among the item value columns in the form to be processed. If there is, prior to assigning the constraint, first, from the form information held in the form holding unit 172, an item name set is obtained for each item value column of the form at the time of form registration. Here, the item name set refers to a set of character strings in the item name column associated with each item value column. Next, for each item name set, an item name column set is created by selecting and assigning an item name column having a character string included in the item name set from among the item name columns in the form to be processed. Here, the item name column set refers to a set of item name columns. At that time, if there are multiple item name fields with the same character string, that is, the item name in the form to be processed, and multiple allocation methods are possible, enumerate the item name field sets as many as the number of allocation methods. do. On top of that, the constraint condition ``The item name column and the item value column are associated only when the relative placement pattern allows association'', and the constraint condition ``Each item name column set can have at most one associated with the item value field" and the constraint condition "Each item value field is associated with at most one item name field set" and the constraint condition "the number of item name field sets generated for the same item name set Among them, at most one is associated with the item value column." In addition, among the items included in the registered form information, if items that are essential for processing are specified, for each item name set of those items, the constraint condition "Items generated from the same item name set Among the first name column set, exactly one is associated with the item value column” is further added.

また、制約条件については、図15、図17に例示する。図15は、様式登録時における制約条件の一例を示す図である。図15に例示するように、「各項目値欄は、少なくとも1個以上の項目名欄と関連付く」ことと(図15の(1)式参照)、「項目名欄と項目値欄が関連付けられるのは、関連付けが許容される相対配置パターンである場合に限られる」ことと(図15の(2)式参照)、「文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個」であることと(図15の(3)式参照)、「項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なる」こと(図15の(4)式参照)が様式登録時の制約条件として付与される。 Constraint conditions are illustrated in FIGS. 15 and 17. FIG. FIG. 15 is a diagram showing an example of constraints at the time of form registration. As exemplified in FIG. 15, "each item value column is associated with at least one or more item name columns" (see formula (1) in FIG. 15), and "the item name column and the item value column are associated is limited to relative placement patterns that allow association” (see formula (2) in FIG. 15), and “if there are multiple item name fields with the same character string, the same item A maximum of one item can be associated with a value column” (see formula (3) in FIG. 15), and “a set of item names described in associated item name columns must be mutually associated between item value columns. "different" (see formula (4) in FIG. 15) is given as a constraint at the time of form registration.

また、本実施形態では、登録済み様式情報利用時には、項目値欄と項目名欄セットの関連の有無を追加の変数として置き、図17に例示するように、「各項目値欄は、最大1個の項目名欄セットと関連付く」ことと(図17の(1)式参照)、「各項目名欄セットは最大1個の項目値欄と関連付く」ことと「各項目名セットについて、同じ項目名セットから生成される項目名欄セットのうち、項目値欄に関連付くものは最大1個」であることと(図17の(2)式参照)、「項目名欄と項目値欄が関連付けられるのは、関連付けが許容される相対配置パターンである場合に限られる」ことと(図17の(4)式参照)、さらに項目値欄と項目名欄の関連の有無を表す変数と、項目値欄と項目名欄セットの関連の有無を表す変数の間に成立する関係(図17の(5)式参照)が制約条件として付与される。また、様式登録時の帳票の項目のうち、登録済み様式情報利用時において必須の項目がある場合には、「各項目名セットについて、同じ項目名セットから生成される項目名欄セットのうち、項目値欄に関連付くものはちょうど1個」であること(図17の(3)式参照)が追加の制約条件として付与される。 In addition, in this embodiment, when using the registered form information, whether or not there is a relationship between the item value column and the item name column set is set as an additional variable, and as illustrated in FIG. associated with item name column sets” (see formula (1) in FIG. 17), “each item name column set is associated with at most one item value column”, and “each item name set is associated with Among the item name column sets generated from the same item name set, the maximum number of items associated with the item value column is 1” (see formula (2) in FIG. 17), and “the item name column and the item value column is associated only when it is a relative arrangement pattern that allows association” (see formula (4) in FIG. 17), and furthermore, a variable that indicates whether or not the item value column and the item name column are related , and the relation established between the variables representing the presence or absence of association between the item value column and the item name column set (see formula (5) in FIG. 17) is given as a constraint condition. In addition, among the items of the form at the time of form registration, if there is an item that is essential when using the registered form information, "For each item name set, out of the item name column sets generated from the same item name set, As an additional constraint condition, "the number of items associated with the item value column is exactly one" (see formula (3) in FIG. 17) is added.

求解部167は、制約条件付与部によって付与された制約条件を満たし、かつ評価関数生成部によって生成された評価関数を最適化するように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する。 The solution-seeking unit 167 satisfies the constraint conditions imparted by the constraint condition imparting unit and optimizes the evaluation function generated by the evaluation function generation unit. identify associations with

例えば、求解部167では、項目値欄と項目名欄の関連の有無を変数として置き、制約条件を満たし、かつ評価関数を最小化する解の組み合わせを厳密または近似的に求める、あるいは、この問題を近似した数式で表現し解くことで、項目名欄と項目値欄の関連付けを求める。数式の表現方法は、想定する制約条件と評価関数の意味が変わらなければ、ソルバーの利用有無、使用するソルバーにあわせて更に近似した数式表現に変えてもよい。 For example, in the solution finding unit 167, the existence or non-existence of the relationship between the item value column and the item name column is set as a variable, and a combination of solutions that satisfy the constraint conditions and minimize the evaluation function is strictly or approximated. is expressed by an approximating formula and solved to obtain the association between the item name column and the item value column. The expression method of the mathematical formula may be changed to a more approximate mathematical expression according to whether or not a solver is used and the solver to be used, as long as the assumed constraint conditions and the meaning of the evaluation function do not change.

求解部167は、例えば、図19に例示するように、項目名欄と項目値欄との関連付けを特定する。図19は、第1の実施形態に係る情報処理装置による求解例を示す図である。図19の例を挙げて具体的に説明すると、例えば、求解部167は、文字列「契約ID」を含む項目名欄と文字列「12345678」を含む項目値欄とが関連付くものとして特定する。そして、求解部167は、項目名欄と項目値欄の関連情報170hを作業データ蓄積部170に格納する。 For example, as illustrated in FIG. 19, the solution seeking unit 167 identifies the association between the item name column and the item value column. FIG. 19 is a diagram illustrating an example of solution finding by the information processing apparatus according to the first embodiment. Specifically, using the example of FIG. 19, for example, the solution seeking unit 167 specifies that the item name field containing the character string "contract ID" and the item value field containing the character string "12345678" are associated. . Then, the solution seeking unit 167 stores the related information 170h of the item name column and the item value column in the work data accumulation unit 170. FIG.

また、図19に例示するように、例えば、求解部167は、文字列「契約者名義」を含む項目名欄および文字列「フリガナ」を含む項目名欄と、文字列「デンデンタロウ」を含む項目値欄とが関連付くものとして特定する。そして、求解部167は、項目名欄と項目値欄の関連情報170hを作業データ蓄積部170に格納する。 Further, as illustrated in FIG. 19, for example, the solution seeking unit 167 includes an item name column including the character string "contractor's name", an item name column including the character string "furigana", and a character string "dendentaro". It is specified as being associated with the item value column. Then, the solution seeking unit 167 stores the related information 170h of the item name column and the item value column in the work data accumulation unit 170. FIG.

図20に例示するように、項目名欄と項目値欄の関連情報170hは、項目値欄を識別する「項目値欄ID」と、項目名欄を識別する「項目名欄ID」とが対応付けられている。図20は、項目名欄と項目値欄の関連情報を示す図である。 As exemplified in FIG. 20, the related information 170h between the item name column and the item value column corresponds to an "item value column ID" that identifies the item value column and an "item name column ID" that identifies the item name column. attached. FIG. 20 is a diagram showing related information between the item name column and the item value column.

修正部168bは、求解部167によって登録された項目名欄と項目値欄の関連情報170hを修正する。例えば、修正部168bは、ユーザの指示に応じて、作業データ蓄積部170に記憶された項目名欄と項目値欄の関連情報170hを修正する。あるいは、修正部168bでは、ユーザの指示に応じて、項目名個別ルールを追加、変更、削除する。 The correction unit 168b corrects the related information 170h of the item name column and the item value column registered by the solution obtaining unit 167. FIG. For example, the correction unit 168b corrects the related information 170h of the item name column and the item value column stored in the work data accumulation unit 170 according to the user's instruction. Alternatively, the modification unit 168b adds, modifies, or deletes the item name individual rule according to the user's instruction.

登録部168aは、作業データ蓄積部170で保持されている、様式登録時の処理対象帳票の項目名欄と項目値欄の関連付けを求めた結果とその過程で作成されたデータの一部を、帳票の様式を識別する識別子に対応付けて、様式情報として登録する。具体的には、登録部168aは、作業データ蓄積部170に記憶された、欄種別データ170bと、票別記載内容・記載位置データ170cと、相対配置パターン170dと、項目名欄と項目値欄の関連情報170hを、様式保持部172にそれぞれ欄種別データ172b、票別記載内容・記載位置データ172d、相対配置パターン172e、項目名欄と項目値欄の関連情報172aとして登録する。また、設定された項目名個別ルール172cを様式保持部172に登録する。 The registration unit 168a obtains the result of obtaining the association between the item name column and the item value column of the form to be processed at the time of form registration, held in the work data accumulation unit 170, and part of the data created in the process, It is registered as form information in association with an identifier that identifies the form form. Specifically, the registration unit 168a stores column type data 170b, entry content/entry position data 170c for each form, relative arrangement pattern 170d, item name column and item value column stored in the work data accumulation unit 170. related information 170h is registered in the format holding unit 172 as column type data 172b, entry content/entry position data 172d for each form, relative arrangement pattern 172e, and item name column and item value column related information 172a. Also, the set item name individual rule 172 c is registered in the form holding unit 172 .

なお、以上の説明では、登録部では、様式情報として、作業データ蓄積部170に記憶された、欄種別データ170bと、票別記載内容・記載位置データ170cと、相対配置パターン170dと、項目名欄と項目値欄の関連情報170hを、様式保持部172に登録し、登録済みの様式情報利用時に、様式保持部172に登録されたこれらのデータから、様式登録時の帳票の各項目値欄に対し、項目名セットを求めるようにしているが、項目名セットは、様式登録時に登録部で求めておき、様式情報の一部として様式保持部172に登録しておき、登録済みの様式情報利用時には、その項目名セットを利用することとしてもよい。 In the above description, the registration unit uses column type data 170b, entry content/entry position data 170c, relative arrangement pattern 170d, and item names stored in the work data accumulation unit 170 as form information. The related information 170h of the column and the item value column is registered in the form holding unit 172, and when the registered form information is used, each item value column of the form at the time of form registration is obtained from the data registered in the form holding unit 172. However, the item name set is obtained by the registration unit at the time of form registration, registered in the form holding unit 172 as part of the form information, and registered form information At the time of use, the item name set may be used.

また、以上の説明では、記載内容・位置取得部、欄の種別判定部、票分割部、関連付け許容判定部での処理により得られたデータ、相対配置パターン保持部で保持するデータ、様式保持部で保持するデータを、評価関数生成部、制約条件付与部、求解部から成る機能部でそれぞれ処理することにより、登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定しているが、これら評価関数生成部、制約条件付与部、求解部を、ひとつの「求解部」としてまとめた構成とすることや、さらにそのまとめた「求解部」において、入力となるデータは同じとしつつ、内部的には制約条件や評価関数を明示的には用いない方法により、登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定するようにしてもよい。 In the above explanation, the data obtained by the processing in the described content/position acquisition unit, the column type determination unit, the form division unit, the association permission determination unit, the data stored in the relative arrangement pattern storage unit, and the format storage unit By processing the data held in the function part consisting of the evaluation function generation part, the constraint condition provision part, and the solution calculation part, based on the set of item names registered by the registration part, it is included in the form to be processed The association between the item name column and the item value column is specified. In the "solution-seeking section", while the same input data is used, processing is performed based on the set of item names registered by the registration section by a method that does not explicitly use constraints and evaluation functions internally. The association between the item name column and the item value column included in the target form may be identified.

[情報処理装置の処理手順]
次に、図21Aおよび図21Bを用いて、第1の実施形態に係る情報処理装置10の処理手順の例を説明する。図21Aおよび図21Bは、第1の実施形態に係る情報処理装置における全体的な処理の流れの一例を示すフローチャートである。
[Processing procedure of information processing device]
Next, an example of the processing procedure of the information processing apparatus 10 according to the first embodiment will be described with reference to FIGS. 21A and 21B. 21A and 21B are flowcharts showing an example of the overall processing flow in the information processing apparatus according to the first embodiment.

図21Aおよび図21Bに示すように、記載内容・位置取得部161が、帳票のデータを受け付け、帳票における欄の構成領域と欄に含まれる文字列を取得し、作業データ蓄積部170に、記載内容・位置データ170aを格納する(ステップS101)。 As shown in FIGS. 21A and 21B, the description content/position acquisition unit 161 receives the data of the form, acquires the constituent regions of the columns of the form and the character strings included in the columns, and stores the description in the work data accumulation unit 170. As shown in FIGS. The content/position data 170a is stored (step S101).

そして、欄の種別判別部162が、帳票のデータを受け付け、あるいは作業データ蓄積部170で保持されている記載内容・位置データ170aを参照し、帳票の各欄の種別を判別し、作業データ蓄積部170に、欄種別データ170bを格納する(ステップS102)。 Then, the column type discriminating unit 162 receives the data of the form or refers to the description content/position data 170a held in the work data accumulation unit 170, discriminates the type of each column of the form, and accumulates the work data. The column type data 170b is stored in the section 170 (step S102).

続いて、票分割部163が、帳票のデータを受け付け、かつ作業データ蓄積部170で保持されている記載内容・位置データ170aを参照し、帳票を票に分割し、作業データ蓄積部170に、票別記載内容・位置データ170cを格納する(ステップS103)。 Subsequently, the form dividing unit 163 receives the data of the form, refers to the description content/position data 170a held in the work data accumulation unit 170, divides the form into forms, and stores the data in the work data accumulation unit 170. The entry content/position data 170c for each form is stored (step S103).

そして、関連付け許容判定部164は、分割された票についてすべて後述の処理が済んでいるか判定し(ステップS104)、分割された票がすべて処理済みである場合には(ステップS104肯定)、処理を終了する。また、分割された票がすべて処理済みでない場合には(ステップS104否定)、関連付け許容判定部164が、作業データ蓄積部170で保持されている票別記載内容・位置データ170cから、未処理の票(以下、単に「帳票」と記載)のものを1個選択する(ステップS105)。 Then, the association admissibility determination unit 164 determines whether or not all of the divided votes have been processed (step S104). finish. If all of the divided slips have not been processed (No at step S104), the association admissibility determination unit 164 selects the unprocessed One form (hereinafter simply referred to as "form") is selected (step S105).

続いて、関連付け許容判定部164が、選択された票別記載内容・位置データ170cと欄種別データ170bを参照し、項目名欄と項目値欄の各組合せに対し、互いの相対配置パターンを調べ、作業データ蓄積部170に、相対配置パターン170dを格納する(ステップS106)。 Subsequently, the association permission determination unit 164 refers to the selected entry content/position data 170c for each form and the column type data 170b, and examines the relative arrangement pattern for each combination of the item name column and the item value column. , the relative arrangement pattern 170d is stored in the work data accumulation unit 170 (step S106).

そして、様式登録時の処理である場合には(ステップS107肯定)、関連付け許容判定部164が、作業データ蓄積部170で保持されている相対配置パターン170dと、相対配置パターン保持部171で保持されている許容される/されない相対配置パターン171aを参照し、また、修正部168bから項目名個別ルールを受け付け、帳票内の項目名欄と項目値欄の各組合せに対し、関連付く可能性の有無を判定し、作業データ蓄積部170に、関連付け許容情報170eを格納する(ステップS108)。 Then, if the process is for style registration (Yes at step S107), the association admissibility determination unit 164 determines whether the relative arrangement pattern 170d held in the work data accumulation unit 170 and the relative arrangement pattern holding unit 171 By referring to the allowed/unacceptable relative arrangement pattern 171a, the item name individual rule is received from the correction unit 168b, and whether or not there is a possibility of association for each combination of the item name column and the item value column in the form. is determined, and the association permission information 170e is stored in the work data accumulation unit 170 (step S108).

そして、評価関数生成部165が、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと欄種別データ170bと相対配置パターン170dを参照し、評価関数を生成し、作業データ蓄積部170に、適用する評価関数170fを格納する(ステップS109)。 Then, the evaluation function generation unit 165 refers to the form-specific entry content/position data 170c, the column type data 170b, and the relative arrangement pattern 170d held in the work data storage unit 170, generates an evaluation function, and stores the work data. The evaluation function 170f to be applied is stored in the unit 170 (step S109).

続いて、制約条件付与部166が、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと欄種別データ170bと関連付け許容情報170eを参照し、付与する制約条件を列挙し、作業データ蓄積部170に、適用する制約条件170gを格納する(ステップS110)。 Subsequently, the constraint condition imparting unit 166 refers to the form-specific entry content/position data 170c, the column type data 170b, and the association permission information 170e held in the work data storage unit 170, and enumerates the constraint condition to be imparted, The constraint condition 170g to be applied is stored in the work data accumulation unit 170 (step S110).

その後、求解部167が、作業データ蓄積部170で保持されている適用する評価関数170fと適用する制約条件170gを参照し、制約条件を満たし評価関数を最適化する解を求め、作業データ蓄積部170に、項目名欄と項目値欄の関連情報170hを格納する(ステップS111)。 After that, the solution obtaining unit 167 refers to the applied evaluation function 170f and the applied constraint condition 170g held in the work data accumulation unit 170, obtains a solution that satisfies the constraint condition and optimizes the evaluation function, 170, the related information 170h of the item name column and the item value column is stored (step S111).

そして、修正部168bが、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと項目名欄と項目値欄の関連情報170hを参照し、人に提示し、人による修正内容を受け付け、修正内容に応じて、項目名欄と項目値欄の関連情報170hを更新する、または項目名個別ルールを追加・変更・削除する(ステップS112)。 Then, the correction unit 168b refers to the description content/position data 170c for each form and the related information 170h of the item name column and the item value column held in the work data storage unit 170, presents them to the person, and corrects the content by the person. is received, and the related information 170h in the item name column and the item value column is updated, or the item name individual rule is added, changed, or deleted (step S112).

そして、項目名個別ルールの追加・変更・削除がある場合には(ステップS113肯定)、ステップS108の処理に戻る。また、項目名個別ルールの追加・変更・削除がない場合には(ステップS113否定)、登録部168aが、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと欄種別データ170bと相対配置パターン170dと項目名欄と項目値欄の関連情報170hを参照し、また、修正部168bから項目名個別ルールを受け付け、これらを対応づけ、ひとつの様式情報として、様式保持部172に登録する(ステップS114)。 If there is an addition/change/deletion of the item name individual rule (Yes at step S113), the process returns to step S108. If there is no addition, change, or deletion of the individual item name rule (No at step S113), the registration unit 168a registers the entry content/position data 170c for each form and the column type data 170c held in the work data accumulation unit 170. 170b, the relative arrangement pattern 170d, the item name column, and the item value column related information 170h, and the item name individual rule is received from the correction unit 168b, these are associated, and the format holding unit 172 stores them as one format information. (step S114).

また、ステップS107において、様式登録時でない場合には(ステップS107否定)、関連付け許容判定部164は、様式保持部172で保持されている様式情報をすべて適用済みであるか判定する(ステップS115)。 If it is determined in step S107 that the form is not registered (No in step S107), the association admissibility determination unit 164 determines whether all the form information held in the form holding unit 172 has been applied (step S115). .

この結果、様式保持部172で保持されている様式情報をすべて適用済みではないと判定された場合には(ステップS115否定)、関連付け許容判定部164が、様式保持部172で保持されている様式情報から、未適用の様式情報を1個選択する(ステップS116)。 As a result, if it is determined that all of the form information held in the form holding section 172 has not been applied (No at step S115), the association permission judgment section 164 determines whether the form held in the form holding section 172 is A piece of unapplied style information is selected from the information (step S116).

続いて、関連付け許容判定部164が、作業データ蓄積部170で保持されている相対配置パターン170dと、相対配置パターン保持部171で保持されている許容される/されない相対配置パターン171aと、様式情報に含まれる項目名別ルール172cを参照し、帳票内の項目名欄と項目値欄の各組合せに対し、関連付く可能性の有無を判定し、作業データ蓄積部170に、関連付け許容情報170eを格納する(ステップS117)。 Subsequently, the association permission determination unit 164 determines whether the relative arrangement pattern 170d held in the work data accumulation unit 170, the permitted/unacceptable relative arrangement pattern 171a held in the relative arrangement pattern holding unit 171, and the format information. By referring to the rule 172c by item name included in the form, it is determined whether or not there is a possibility of association for each combination of the item name column and the item value column in the form, and the work data storage unit 170 stores the association permission information 170e. Store (step S117).

続いて、評価関数生成部165が、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと欄種別データ170bと相対配置パターン170dと、様式情報に含まれる票別記載内容・位置データ172d、欄種別データ172b、相対配置パターン172e、項目名欄と項目値欄の関連情報172aを参照し、評価関数を生成し、作業データ蓄積部170に、適用する評価関数170fを格納する(ステップS118)。 Subsequently, the evaluation function generation unit 165 generates the form-specific entry content/position data 170c, the column type data 170b, the relative arrangement pattern 170d, and the form-specific entry content/position data 170c held in the work data storage unit 170, and The position data 172d, the column type data 172b, the relative arrangement pattern 172e, and the related information 172a of the item name column and the item value column are referred to, an evaluation function is generated, and the evaluation function 170f to be applied is stored in the work data accumulation unit 170. (Step S118).

そして、制約条件付与部166が、作業データ蓄積部170で保持されている票別記載内容・位置データ170cと欄種別データ170bと関連付け許容情報170eと、様式情報に含まれる票別記載内容・位置データ172d、欄種別データ172b、項目名欄と項目値欄の関連情報172aを参照し、付与する制約条件を列挙し、作業データ蓄積部170に、適用する制約条件を格納する(ステップS119)。 Then, the constraint condition applying unit 166 stores the form-specific entry content/position data 170c and the column type data 170b held in the work data accumulation unit 170, the association permission information 170e, and the form-specific entry content/position contained in the form information. By referring to the data 172d, the column type data 172b, and the related information 172a of the item name column and the item value column, the constraint conditions to be applied are listed, and the constraint conditions to be applied are stored in the work data accumulation unit 170 (step S119).

その後、求解部167が、作業データ蓄積部170で保持されている適用する評価関数170fと適用する制約条件170gを参照し、制約条件を満たし評価関数を最適化する解を求め、作業データ蓄積部170に、項目名欄と項目値欄の関連情報を格納する。また、様式情報から求められる項目名セットのうち、項目値欄と関連付けらえた項目名セットの数をカウントする(ステップS120)。 After that, the solution obtaining unit 167 refers to the applied evaluation function 170f and the applied constraint condition 170g held in the work data accumulation unit 170, obtains a solution that satisfies the constraint condition and optimizes the evaluation function, In 170, related information between the item name column and the item value column is stored. Also, among the item name sets obtained from the form information, the number of item name sets associated with the item value column is counted (step S120).

そして、項目値欄と関連付けられた項目名セットの数について、現在選択されている様式情報適用時の方が、これまでで最良の様式情報適用時より大きくない場合には(ステップS121否定)、ステップS115の処理に戻る。また、項目値欄と関連付けられた項目名セットの数について、現在選択されている様式情報適用時の方が、これまでで最良の様式情報適用時より大きい場合には(ステップS121肯定)、現在選択されている様式情報と、項目名欄と項目値欄の関連情報と、項目値欄と関連付けらえた項目名セットの数を、これまでで最良の様式情報適用時のものとして、保持し(ステップS122)、ステップS115の処理に戻る。 Then, if the number of item name sets associated with the item value column is not greater when the currently selected form information is applied than when the best form information is applied (No at step S121), It returns to the process of step S115. Further, if the number of item name sets associated with the item value column is greater when the currently selected form information is applied than when the best form information is applied (Yes at step S121), the current Holds the selected form information, the related information of the item name field and the item value field, and the number of item name sets associated with the item value field, as the best ever when applying the form information ( Step S122) and returns to the process of step S115.

また、ステップS115において、様式保持部172で保持されている様式情報をすべて適用済みであると判定された場合には(ステップS115肯定)、これまでで最良の様式情報適用時のものとして保持されている、項目名欄と項目値欄の関連情報を、選択された票における、項目名欄と項目値欄の関連情報とし(ステップS123)、ステップS104に戻る。 If it is determined in step S115 that all of the form information held in the form holding unit 172 has been applied (Yes in step S115), the form information is held as the best form information applied so far. The related information of the item name column and the item value column, which is stored, is set as the related information of the item name column and the item value column in the selected form (step S123), and the process returns to step S104.

次に、図22を用いて、第1の実施形態に係る情報処理装置10の許容される/されない相対配置パターン登録時の処理手順の例を説明する。図22は、図22は、第1の実施形態に係る情報処理装置10の許容相対配置パターン生成部における処理の流れの一例を示すフローチャートである。 Next, with reference to FIG. 22, an example of a processing procedure at the time of allowed/unallowed relative arrangement pattern registration of the information processing apparatus 10 according to the first embodiment will be described. FIG. 22 is a flow chart showing an example of the flow of processing in the allowable relative arrangement pattern generation unit of the information processing apparatus 10 according to the first embodiment.

図22に示すように、許容相対配置パターン生成部169が、帳票処理ツール外から、票別記載内容・位置データ、欄種別データ、項目名欄と項目値欄の関連情報に相当する入力データを受け付ける(ステップS201)。そして、許容相対配置パターン生成部169が、未処理の関連付けられた項目名欄と項目値欄の組合せがあるか判定し(ステップS202)、組合せがないと判定した場合には(ステップS202否定)、処理を終了する。 As shown in FIG. 22, the permissible relative arrangement pattern generation unit 169 generates input data corresponding to related information for each form description content/position data, column type data, and item name column and item value column from outside the form processing tool. Accept (step S201). Then, the allowable relative arrangement pattern generation unit 169 determines whether there is a combination of unprocessed associated item name columns and item value columns (step S202), and if it is determined that there is no combination (step S202 negative). , terminate the process.

また、許容相対配置パターン生成部169が、未処理の関連付けられた項目名欄と項目値欄の組合せがあると判定した場合には(ステップS202肯定)、未処理の関連付けられた項目名欄と項目値欄の組合せを1個選択する(ステップS203)。そして、許容相対配置パターン生成部169が、受け付けた、票別記載内容・位置データを参照し、選択された組合せについて、項目名欄を基準とした項目値欄の相対配置パターンと、項目値欄を基準とした項目名欄の相対配置パターンを調べる(ステップS204)。 Further, when the allowable relative arrangement pattern generation unit 169 determines that there is a combination of unprocessed associated item name fields and item value fields (Yes at step S202), the unprocessed associated item name fields and One combination of item value columns is selected (step S203). Then, the allowable relative arrangement pattern generation unit 169 refers to the received entry content/position data for each form, and for the selected combination, generates a relative arrangement pattern of the item value column based on the item name column and the item value column. is checked for the relative layout pattern of the item name column (step S204).

続いて、許容相対配置パターン生成部169が、項目名欄を基準とした項目値欄の相対配置パターンと、項目値欄を基準とした項目名欄の相対配置パターンのそれぞれについて、相対配置パターン保持部171で保持されている、許容される/されない相対配置パターン171aの、該当の相対配置パターンの関連付け事例数を1加算する(ステップS205)。 Next, the permissible relative arrangement pattern generation unit 169 holds relative arrangement patterns for each of the relative arrangement pattern of the item value column with reference to the item name column and the relative arrangement pattern of the item name column with reference to the item value column. One is added to the number of association cases of the permissible/unacceptable relative arrangement pattern 171a held in the unit 171 (step S205).

そして、許容相対配置パターン生成部169が、相対配置パターンの関連付け事例数が閾値を超えているか判定し(ステップS206)、相対配置パターンの関連付け事例数が閾値を超えていないと判定した場合には(ステップS206否定)、ステップS202の処理に戻る。 Then, the allowable relative arrangement pattern generation unit 169 determines whether or not the number of association cases of relative arrangement patterns exceeds the threshold (step S206). (No at step S206), the process returns to step S202.

また、許容相対配置パターン生成部169は、相対配置パターンの関連付け事例数が閾値を超えていると判定した場合には(ステップS206肯定)、相対配置パターン保持部171で保持されている、許容される/されない相対配置パターン171aの、該当の相対配置パターンの許容可否を「○」に更新し(ステップS207)、ステップS202の処理に戻る。 Further, when the allowable relative arrangement pattern generation unit 169 determines that the number of association cases of the relative arrangement pattern exceeds the threshold (Yes at step S206), the allowable relative arrangement pattern holding unit 171 holds In the relative arrangement pattern 171a that is/is not allowed, the permissibility of the relative arrangement pattern is updated to "O" (step S207), and the process returns to step S202.

次に、図23~図25を用いて、第1の実施形態に係る情報処理装置10の記載内容・位置取得部161による処理手順の例を説明する。図23~図25は、第1の実施形態に係る情報処理装置の記載内容・位置取得部における処理の流れの一例を示すフローチャートである。 Next, an example of a processing procedure performed by the description content/position acquisition unit 161 of the information processing apparatus 10 according to the first embodiment will be described with reference to FIGS. 23 to 25. FIG. 23 to 25 are flowcharts showing an example of the flow of processing in the description content/position acquiring unit of the information processing apparatus according to the first embodiment.

まず、図23を用いて、帳票の欄が罫線で囲われている場合の記載内容・位置取得部161による処理を説明する。図23に例示するように、記載内容・位置取得部161は、オブジェクト総数をnと設定し、iの値を「1」と設定し、未探索集合を[1・・・n]と設定する(ステップS301)。そして、記載内容・位置取得部161は、iの値がnの値よりも大きいか判定する(ステップS302)。 First, with reference to FIG. 23, the processing by the description content/position acquiring unit 161 when the columns of the form are surrounded by ruled lines will be described. As illustrated in FIG. 23, the description content/position acquisition unit 161 sets the total number of objects to n, sets the value of i to "1", and sets the unsearched set to [1...n]. (Step S301). Then, the description content/position acquiring unit 161 determines whether the value of i is greater than the value of n (step S302).

この結果、記載内容・位置取得部161は、iの値がnの値よりも大きくない場合には(ステップS302否定)、i番目のオブジェクトの上と左に罫線があるか判定する(ステップS303)。この結果、記載内容・位置取得部161は、i番目のオブジェクトの上と左に罫線がない場合には(ステップS303否定)、ステップS308の処理に進む。また、記載内容・位置取得部161は、i番目のオブジェクトの上と左に罫線がある場合には(ステップS303肯定)、記載内容・位置取得部161は、i番目から罫線を時計回りに周回したオブジェクト集合を取得する(ステップS304)。 As a result, if the value of i is not greater than the value of n (No at step S302), the description content/position acquisition unit 161 determines whether there are ruled lines on the top and left of the i-th object (step S303). ). As a result, if there are no ruled lines above and to the left of the i-th object (No at step S303), the description content/position acquisition unit 161 proceeds to the process at step S308. If there are ruled lines above and to the left of the i-th object (Yes at step S303), the description content/position acquiring unit 161 rotates the ruled lines clockwise from the i-th object. A set of objects is acquired (step S304).

そして、記載内容・位置取得部161は、周回したオブジェクトを取得できたか判定する(ステップS305)。この結果、記載内容・位置取得部161は、周回したオブジェクトを取得できなかった場合には(ステップS305否定)、ステップS308の処理に進む。また、記載内容・位置取得部161は、周回したオブジェクトを取得できた場合には(ステップS305肯定)、周回したオブジェクト集合を1つの欄として、文字列や領域の情報を、作業データ蓄積部170に記載内容・位置データ170aとして保存する(ステップS306)。 Then, the description content/position acquisition unit 161 determines whether or not the circulated object has been acquired (step S305). As a result, if the description content/position acquisition unit 161 cannot acquire the object that has circulated (No at step S305), the process proceeds to step S308. In addition, when the description content/position acquisition unit 161 can acquire the circled object (Yes at step S305), the description content/position acquisition unit 161 stores the information of the character string and the area with the circled object set as one column, and the work data storage unit 170 is saved as description content/position data 170a (step S306).

続いて、記載内容・位置取得部161は、周回したオブジェクト集合を未探索集合から削除し(ステップS307)、iの値に「1」を追加し(ステップS308)、ステップS302の処理に戻る。 Subsequently, the described content/position acquiring unit 161 deletes the circled object set from the unsearched set (step S307), adds "1" to the value of i (step S308), and returns to the process of step S302.

ステップS302において、記載内容・位置取得部161は、iの値がnの値よりも大きい場合には(ステップS302肯定)、未探索集合にオブジェクトがないか判定し(ステップS309)、未探索集合にオブジェクトがある場合には(ステップS309否定)、未探索集合から任意のオブジェクトを選択する(ステップS310)。 In step S302, when the value of i is greater than the value of n (Yes in step S302), the description content/position acquiring unit 161 determines whether there is an object in the unsearched set (step S309). If there is an object in (No at step S309), an arbitrary object is selected from the unsearched set (step S310).

そして、記載内容・位置取得部161は、オブジェクトを1つの欄として、作業データ蓄積部170に記載内容・位置データ170aを保存し(ステップS311)、未探索集合から、選択したオブジェクトのインデックスを削除し(ステップS312)、ステップS309の処理に戻る。また、記載内容・位置取得部161は、未探索集合にオブジェクトがない場合には(ステップS309肯定)、処理を終了する。 Then, the description content/position acquisition unit 161 stores the description content/position data 170a in the work data accumulation unit 170 with the object as one column (step S311), and deletes the index of the selected object from the unsearched set. (step S312), and the process returns to step S309. If there is no object in the unsearched set (Yes at step S309), the description content/position acquisition unit 161 ends the process.

次に、図24を用いて、帳票の欄が罫線で囲われていない場合の記載内容・位置取得部161による処理を説明する。図24に例示するように、記載内容・位置取得部161は、オブジェクト総数をnと設定し、iの値を「1」と設定し、未探索集合を[1・・・n]と設定する(ステップS401)。そして、記載内容・位置取得部161は、未探索集合にオブジェクトがないか判定し(ステップS402)、未探索集合にオブジェクトがある場合には(ステップS402否定)、未探索集合から任意のオブジェクトを選択する(ステップS403)。 Next, with reference to FIG. 24, processing by the description content/position acquiring unit 161 when the columns of the form are not surrounded by ruled lines will be described. As illustrated in FIG. 24, the description content/position acquisition unit 161 sets the total number of objects to n, sets the value of i to "1", and sets the unsearched set to [1...n]. (Step S401). Then, the description content/position acquisition unit 161 determines whether or not there is an object in the unsearched set (step S402). Select (step S403).

そして、記載内容・位置取得部161は、オブジェクトを1つの欄として、作業データ蓄積部170に記載内容・位置データ170aを保存し(ステップS404)、未探索集合から、選択したオブジェクトのインデックスを削除し(ステップS405)、ステップS402の処理に戻る。また、記載内容・位置取得部161は、未探索集合にオブジェクトがない場合には(ステップS402肯定)、処理を終了する。 Then, the described content/position acquisition unit 161 stores the described content/position data 170a in the work data accumulation unit 170 with the object as one column (step S404), and deletes the index of the selected object from the unsearched set. (step S405), and the process returns to step S402. If there is no object in the unsearched set (Yes at step S402), the description content/position acquisition unit 161 ends the process.

次に、図25を用いて、帳票が画像データである場合の記載内容・位置取得部161による処理を説明する。記載内容・位置取得部161は、画像から罫線を抽出し(ステップS501)、罫線から画像を分割する(ステップS502)。そして、記載内容・位置取得部161は、画像の総数をnと設定し、iの値を「1」と設定する(ステップS503)。 Next, with reference to FIG. 25, processing by the description content/position acquisition unit 161 when the form is image data will be described. The description content/position acquisition unit 161 extracts ruled lines from the image (step S501), and divides the image from the ruled lines (step S502). Then, the description content/position acquiring unit 161 sets the total number of images to n, and sets the value of i to "1" (step S503).

そして、記載内容・位置取得部161は、iの値がnの値よりも大きいか判定する(ステップS504)。この結果、記載内容・位置取得部161は、iの値がnの値よりも大きくない場合には(ステップS504否定)、画像上の文字を認識し(ステップS505)、認識した文字と画像の領域に関する情報を作業データ蓄積部170に記載内容・位置データ170aとして保存する(ステップS506)。 Then, the description content/position acquiring unit 161 determines whether the value of i is greater than the value of n (step S504). As a result, if the value of i is not greater than the value of n (No at step S504), the description content/position acquisition unit 161 recognizes the characters on the image (step S505), and The information about the area is stored in the work data accumulation unit 170 as the described content/position data 170a (step S506).

続いて、記載内容・位置取得部161は、iの値に「1」を追加し(ステップS507)、ステップS504の処理に戻る。また、ステップS504において、記載内容・位置取得部161は、iの値がnの値よりも大きいと判定した場合には(ステップS504肯定)、処理を終了する。 Subsequently, the description content/position acquiring unit 161 adds “1” to the value of i (step S507), and returns to the process of step S504. In step S504, when the description content/position acquisition unit 161 determines that the value of i is greater than the value of n (Yes in step S504), the process ends.

[第1の実施形態の効果]
このように、第1の実施形態に係る情報処理装置10は、様式情報を登録し、登録済み様式情報利用時には、登録した様式情報から求められる項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する。このため、帳票の欄の配置に変更があった場合であっても、帳票に含まれる項目名欄と項目値欄との関連付けを特定すること可能である。
[Effects of the first embodiment]
As described above, the information processing apparatus 10 according to the first embodiment registers the form information, and when using the registered form information, based on the set of item names obtained from the registered form information, Identifies the association between the included item name column and the item value column. Therefore, even if the layout of the columns of the form is changed, it is possible to identify the association between the item name column and the item value column included in the form.

また、第1の実施形態に係る情報処理装置10は、欄の形状や、欄同士が隣接しているかどうかに問わず、欄を基準にした他の欄の存在領域の分布パターン(相対配置パターン)により、項目名欄と項目値欄の関連付く可能性の有無を判断する。このため、情報処理装置10では、従来技術で仮定していた項目名欄や項目値欄の形状やそれらの配置パターンに関する条件を満たさない帳票に対しても、項目名欄と項目値欄の関連付けが可能になる。 In addition, the information processing apparatus 10 according to the first embodiment can determine the distribution pattern (relative arrangement pattern) of the existing areas of other columns based on the column, regardless of the shape of the column or whether the columns are adjacent to each other. ) determines whether or not there is a possibility that the item name column and the item value column are related. For this reason, in the information processing apparatus 10, even for a form that does not satisfy the conditions regarding the shapes of the item name columns and the item value columns and their arrangement patterns assumed in the conventional technology, the association between the item name columns and the item value columns is possible. becomes possible.

例えば、従来技術では、各項目値欄に対して隣接する項目名欄のみとの関連の有無を判断し、かつ2つの項目名欄同士の配置から項目名欄同士の親子関係を判断し、さらに、これらを組み合わせて関連の有無を間接的に決定していたため、項目値欄と隣接しない項目名欄との関連付けが不適切になる場合があった。これに対して、第1の実施形態に係る情報処理装置10は、任意の項目名欄、項目値欄の組合せに関して、関連付く可能性の有無を判断するので、項目値欄と隣接しない項目名欄との関連付けが不適切になる場合をなくすことが可能である。 For example, in the prior art, it is determined whether or not each item value column is associated with only the adjacent item name columns, and the parent-child relationship between the item name columns is determined from the arrangement of the two item name columns. , the presence or absence of a relationship was indirectly determined by combining these, so there were cases where the association between the item value column and the item name column not adjacent to each other became inappropriate. On the other hand, the information processing apparatus 10 according to the first embodiment determines whether or not there is a possibility of being associated with any combination of the item name column and the item value column. It is possible to eliminate the case where the association with the column becomes inappropriate.

また、第1の実施形態に係る情報処理装置10は、様式登録時、関連付く可能性のある組合せの中で、各項目値欄がいずれかの項目名欄と対応づく制約条件を付与することにより、様式登録時は、どの項目名欄とも関連付けられない項目値欄が残らず、すべての項目値欄に対して項目名欄が関連付けられるよう、項目名欄と項目値との関連付けを求めることができる。 In addition, the information processing apparatus 10 according to the first embodiment gives a constraint condition that each item value column corresponds to one of the item name columns among combinations that may be associated when the form is registered. Therefore, when registering the form, ask for the association between the item name column and the item value so that there are no item value columns that are not associated with any item name column and all item value columns are associated with the item name column. can be done.

また、第1の実施形態に係る情報処理装置10は、許容される相対配置パターンを項目名別に指定したうえで、項目名欄と項目値欄の関連付く可能性の有無を判断し、他の制約条件とともに解を探索できるようにすることにより、許容される/されない相対配置パターンが汎用的な項目とは異なる項目であっても、項目名欄と項目値との関連付けを適切に求めることができる。 In addition, the information processing apparatus 10 according to the first embodiment designates a permissible relative arrangement pattern for each item name, determines whether or not there is a possibility that the item name column and the item value column are related, and By making it possible to search for solutions together with constraint conditions, it is possible to appropriately obtain associations between item name fields and item values even for items with different allowable/not allowed relative placement patterns from general-purpose items. can.

また、第1の実施形態に係る情報処理装置10は、登録済み様式情報利用時の処理対象帳票に、様式登録時の帳票に存在しない項目が含まれていても、再度様式登録を行うことなく、様式登録時の帳票に存在していた全項目について、項目名欄と項目値との関連付けを求めることができる。 Further, the information processing apparatus 10 according to the first embodiment does not register the form again even if the form to be processed when the registered form information is used includes an item that does not exist in the form when the form is registered. For all the items that existed in the form at the time of form registration, it is possible to obtain the association between the item name column and the item value.

また、第1の実施形態に係る情報処理装置10は、例えば、様式登録時の帳票と、登録済み様式情報利用時の処理対象帳票で、項目名が縦と横の両方に配置されている場合に縦と横が入れ替わった場合や、項目名の親子関係の順序性が変わった場合でも、項目値欄の位置を特定できる。 In addition, the information processing apparatus 10 according to the first embodiment, for example, when item names are arranged both vertically and horizontally in a form when registering a form and a form to be processed when using registered form information, The position of the item value column can be identified even when the vertical and horizontal are reversed, or when the order of the parent-child relationship of the item names is changed.

(システム構成等)
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
(system configuration, etc.)
Also, each component of each device illustrated is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution and integration of each device is not limited to the one shown in the figure, and all or part of them can be functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured. Further, each processing function performed by each device may be implemented in whole or in part by a CPU and a program analyzed and executed by the CPU, or implemented as hardware based on wired logic.

また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。 In addition, among the processes described in the present embodiment, all or part of the processes described as being performed automatically can be performed manually, or the processes described as being performed manually can be performed manually. can also be performed automatically by known methods. In addition, information including processing procedures, control procedures, specific names, and various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified.

(プログラム)
また、上記実施形態において説明した情報処理装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係る情報処理装置10が実行する処理をコンピュータが実行可能な言語で記述した関連付けプログラムを作成することもできる。この場合、コンピュータが関連付けプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる関連付けプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された関連付けプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
(program)
It is also possible to create a program in which the processing executed by the information processing apparatus described in the above embodiment is written in a computer-executable language. For example, it is possible to create an association program in which the processing executed by the information processing apparatus 10 according to the embodiment is described in a computer-executable language. In this case, the same effects as those of the above embodiment can be obtained by executing the association program by the computer. Further, such an association program may be recorded in a computer-readable recording medium, and a computer may read and execute the association program recorded in the recording medium to realize processing similar to that of the above embodiment.

図26は、関連付けプログラムを実行するコンピュータを示す図である。図26に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。 FIG. 26 is a diagram showing a computer that executes an association program. As illustrated in FIG. 26, computer 1000 includes, for example, memory 1010, CPU 1020, hard disk drive interface 1030, disk drive interface 1040, serial port interface 1050, video adapter 1060, and network interface 1070. , and these units are connected by a bus 1080 .

メモリ1010は、図26に例示するように、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図26に例示するように、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、図26に例示するように、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、図26に例示するように、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、図26に例示するように、例えばディスプレイ1130に接続される。 The memory 1010 includes a ROM (Read Only Memory) 1011 and a RAM 1012 as illustrated in FIG. The ROM 1011 stores a boot program such as BIOS (Basic Input Output System). Hard disk drive interface 1030 is connected to hard disk drive 1090 as illustrated in FIG. Disk drive interface 1040 is connected to disk drive 1100 as illustrated in FIG. A removable storage medium such as a magnetic disk or optical disk is inserted into the disk drive 1100 . The serial port interface 1050 is connected to, for example, a mouse 1110 and a keyboard 1120 as illustrated in FIG. Video adapter 1060 is connected to display 1130, for example, as illustrated in FIG.

ここで、図26に例示するように、ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、上記の、関連付けプログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1090に記憶される。 Here, as illustrated in FIG. 26, the hard disk drive 1090 stores an OS 1091, application programs 1092, program modules 1093, and program data 1094, for example. That is, the association program described above is stored, for example, in hard disk drive 1090 as a program module in which instructions to be executed by computer 1000 are described.

また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、各種処理手順を実行する。 Various data described in the above embodiments are stored as program data in the memory 1010 or the hard disk drive 1090, for example. Then, the CPU 1020 reads the program modules 1093 and program data 1094 stored in the memory 1010 and the hard disk drive 1090 to the RAM 1012 as necessary, and executes various processing procedures.

なお、関連付けプログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、関連付けプログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。 Note that the program module 1093 and the program data 1094 related to the association program are not limited to being stored in the hard disk drive 1090. For example, they may be stored in a removable storage medium and read by the CPU 1020 via a disk drive or the like. good. Alternatively, the program module 1093 and program data 1094 related to the association program are stored in another computer connected via a network (LAN (Local Area Network), WAN (Wide Area Network), etc.), and are stored via the network interface 1070. may be read by the CPU 1020 at the same time.

10 情報処理装置
11a 操作入力部
11b 帳票入力部
12 表示部
13 OS
14 記憶部
15 エディタ
16 帳票処理ツール
161 記載内容・位置取得部
162 欄の種別判別部
163 票分割部
164 関連付け許容判定部
165 評価関数生成部
166 制約条件付与部
167 求解部
168a 登録部
168b 修正部
169 許容相対配置パターン生成部
170 作業データ蓄積部
170a 記載内容・位置データ
170b、172b 欄種別データ
170c、172d 票別記載内容・位置データ
170d、172e 相対配置パターン
170e 関連付け許容情報
170f 適用する評価関数
170g 適用する制約条件
170h、172a 項目名欄と項目値欄の関連情報
171 相対配置パターン保持部
171a 許容される/されない相対配置パターン
172 様式保持部
172c 項目名別ルール
REFERENCE SIGNS LIST 10 information processing device 11a operation input unit 11b form input unit 12 display unit 13 OS
14 storage unit 15 editor 16 form processing tool 161 description content/position acquisition unit 162 column type determination unit 163 form division unit 164 association admissibility determination unit 165 evaluation function generation unit 166 constraint condition provision unit 167 solving unit 168a registration unit 168b correction unit 169 allowable relative arrangement pattern generation unit 170 work data accumulation unit 170a entry content/position data 170b, 172b column type data 170c, 172d entry content/position data for each form 170d, 172e relative arrangement pattern 170e association permission information 170f applicable evaluation function 170g Constraints to be applied 170h, 172a Related information between item name column and item value column 171 Relative arrangement pattern storage unit 171a Permissible/unacceptable relative arrangement pattern 172 Style storage unit 172c Rule by item name

Claims (9)

所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録部と、
前記登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解部とを
し、
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与部をさらに有し、
前記求解部は、前記制約条件付与部によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする情報処理装置。
a registration unit for registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
a solution-seeking unit that identifies associations between item name columns and item value columns included in a form to be processed based on the set of item names registered by the registration unit ;
When the item name column and the item value column in the form to be processed can be distinguished, the item name column and the item value column are associated when the association is permitted from the viewpoint of the relative arrangement relationship of the columns. , each item value field is associated with at least one or more item name fields, and if there are multiple item name fields with the same character string, the same item value field and The apparatus further includes a constraint condition providing unit that provides a constraint condition that at most one item can be associated and a constraint condition that the item value columns have different sets of item names described in the associated item name columns. death,
The information processing apparatus, wherein the solution-seeking unit identifies associations between item name columns and item value columns included in the form to be processed so as to satisfy the constraint conditions imparted by the constraint condition imparting unit .
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録部と、
前記登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解部とを
有し、
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与部をさらに有し
前記求解部は、前記制約条件付与部によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする情報処理装置。
a registration unit for registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
a solution-seeking unit that identifies associations between item name columns and item value columns included in the form to be processed, based on the set of item names registered by the registration unit;
have
When processing another form using the form information of a form in which the association between the item value field and the item name field is specified in advance, each item name set held in the registered form information is subject to processing The item name column set in the form is generated, and the item name column and the item value column are associated only when the association is permitted from the viewpoint of the relative arrangement relationship of the columns, and each An item value column is generated for the same item name set under the constraint that it is associated with at most one item name column set, and with the constraint that each item name column set is associated with at most one item value column. and a constraint condition giving unit that gives a constraint that at most one item value column is associated with the item value column in the set of item name columns that are set, 1. An information processing apparatus that specifies association between an item value column and an item name column set included in a form to be processed and association between an item name column and an item value column so as to satisfy conditions.
前記処理対象の帳票中の各欄を基準にして他の欄の存在領域の分布パターンをそれぞれ求め、該分布パターンと、予め設定された許容される分布パターンおよび許容されない分布パターンのうちのいずれか一つまたは両方と比較し、前記処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定する関連付け許容判定部をさらに有することを特徴とする請求項1または2に記載の情報処理装置。 Based on each column in the form to be processed, the distribution pattern of the existence area of the other columns is obtained, and the distribution pattern and one of a preset allowable distribution pattern and an unacceptable distribution pattern. 3. An association admissibility determination unit that compares one or both and determines whether or not there is a possibility of an association between the item name column and the item value column in the form to be processed. The information processing device according to . 前記関連付け許容判定部は、予め設定された許容される分布パターンおよび許容されない分布パターンのうちのいずれか一つまたは両方を項目名別に定義する項目名個別ルールが設定されている場合には、該項目名個別ルールに応じて、前記処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定することを特徴とする請求項に記載の情報処理装置。 When an item name individual rule is set to define one or both of a preset allowable distribution pattern and an unacceptable distribution pattern for each item name, the association permission determination unit 4. The information processing apparatus according to claim 3 , wherein whether or not there is a possibility of association between the item name column and the item value column in the form to be processed is determined according to an item name individual rule. 所定の様式の帳票における項目名欄と項目値欄との関連付けから、相対配置パターンを取得して、取得した相対配置パターンを基に許容する配置パターンのデータを作成する許容相対配置パターン生成部をさらに有することを特徴とする請求項1または2に記載の情報処理装置。 an allowable relative arrangement pattern generation unit that acquires a relative arrangement pattern from the association between the item name column and the item value column in a form of a predetermined format and creates data of an allowable arrangement pattern based on the acquired relative arrangement pattern; 3. The information processing apparatus according to claim 1, further comprising: 情報処理装置によって実行される関連付け方法であって、
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録工程と、
前記登録工程によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解工程と
を含み、
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与工程をさらに含み、
前記求解工程は、前記制約条件付与工程によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする関連付け方法。
An association method executed by an information processing device,
a registration step of registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
a solution-seeking step of identifying associations between item name columns and item value columns included in the form to be processed, based on the set of item names registered in the registration step ;
When the item name column and the item value column in the form to be processed can be distinguished, the item name column and the item value column are associated when the association is permitted from the viewpoint of the relative arrangement relationship of the columns. , each item value field is associated with at least one or more item name fields, and if there are multiple item name fields with the same character string, the same item value field and Further includes a constraint condition giving step of giving a constraint condition that at most one item can be associated and a constraint condition that the item value columns have different sets of item names described in the associated item name columns. ,
An association method , wherein the step of obtaining a solution specifies association between item name columns and item value columns included in the form to be processed so as to satisfy the constraint conditions imparted by the constraint condition imparting step .
情報処理装置によって実行される関連付け方法であって、 An association method executed by an information processing device,
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録工程と、 a registration step of registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
前記登録工程によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解工程と a solution-seeking step of identifying associations between item name columns and item value columns included in a form to be processed, based on the set of item names registered in the registration step;
を含み、 including
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与工程をさらに含み、 When processing another form using the form information of a form in which the association between the item value field and the item name field is specified in advance, each item name set held in the registered form information is subject to processing The item name column set in the form is generated, and the item name column and the item value column are associated only when the association is permitted from the viewpoint of the relative arrangement relationship of the columns, and each An item value column is generated for the same item name set under the constraint that it is associated with at most one item name column set, and with the constraint that each item name column set is associated with at most one item value column. further comprising a constraint condition giving step of giving a constraint condition that at most one item value column is associated with the item name column set,
前記求解工程は、前記制約条件付与工程によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする関連付け方法。 The solution-seeking step associates an item value column and an item name column set included in a form to be processed, and an association between an item name column and an item value column so as to satisfy the constraint condition given by the constraint condition assigning step. A method of association characterized by identifying
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録ステップと、
前記登録ステップによって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解ステップと
をコンピュータに実行させ
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与ステップをさらにコンピュータに実行させ、
前記求解ステップは、前記制約条件付与ステップによって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする関連付けプログラム。
a registration step of registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
causing a computer to execute a solution finding step of identifying associations between item name columns and item value columns included in a form to be processed based on the set of item names registered in the registering step ;
When the item name column and the item value column in the form to be processed can be distinguished, the item name column and the item value column are associated when the association is permitted from the viewpoint of the relative arrangement relationship of the columns. , each item value field is associated with at least one or more item name fields, and if there are multiple item name fields with the same character string, the same item value field and The computer further performs a constraint condition imparting step of imparting a constraint condition that at most one item can be associated and a constraint condition that item value columns have different sets of item names described in associated item name columns. and run
The association program , wherein the step of obtaining a solution identifies association between item name columns and item value columns included in the form to be processed so as to satisfy the constraint condition imparted by the constraint condition imparting step .
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録ステップと、 a registration step of registering a set of item names associated with item name columns associated with item value columns in a predetermined form;
前記登録ステップによって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解ステップと a solution finding step of identifying associations between item name columns and item value columns included in the form to be processed, based on the set of item names registered in the registering step;
をコンピュータに実行させ、 on the computer, and
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与ステップをさらコンピュータに実行させ、 When processing another form using the form information of a form in which the association between the item value field and the item name field is specified in advance, each item name set held in the registered form information is subject to processing The item name column set in the form is generated, and the item name column and the item value column are associated only when the association is permitted from the viewpoint of the relative arrangement relationship of the columns, and each An item value column is generated for the same item name set under the constraint that it is associated with at most one item name column set, and with the constraint that each item name column set is associated with at most one item value column. causing the computer to further execute a constraint condition imparting step of imparting a constraint condition that at most one item value column is associated with the item name column set,
前記求解ステップは、前記制約条件付与ステップによって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする関連付けプログラム。 The solution finding step associates an item value column and an item name column set included in the form to be processed, and an association between the item name column and the item value column so as to satisfy the constraint condition imparted by the constraint condition imparting step. A correlating program characterized by identifying a
JP2019034980A 2019-02-27 2019-02-27 Information processing device, association method and association program Active JP7211157B2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2019034980A JP7211157B2 (en) 2019-02-27 2019-02-27 Information processing device, association method and association program
PCT/JP2020/005631 WO2020175163A1 (en) 2019-02-27 2020-02-13 Information processing device, associating method, and associating program
US17/433,718 US20220165077A1 (en) 2019-02-27 2020-02-13 Information processing device, associating method, and associating program
EP20763375.1A EP3910546A4 (en) 2019-02-27 2020-02-13 Information processing device, associating method, and associating program
CN202080016620.8A CN113508393A (en) 2019-02-27 2020-02-13 Information processing apparatus, correlation method, and correlation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019034980A JP7211157B2 (en) 2019-02-27 2019-02-27 Information processing device, association method and association program

Publications (2)

Publication Number Publication Date
JP2020140410A JP2020140410A (en) 2020-09-03
JP7211157B2 true JP7211157B2 (en) 2023-01-24

Family

ID=72239968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019034980A Active JP7211157B2 (en) 2019-02-27 2019-02-27 Information processing device, association method and association program

Country Status (5)

Country Link
US (1) US20220165077A1 (en)
EP (1) EP3910546A4 (en)
JP (1) JP7211157B2 (en)
CN (1) CN113508393A (en)
WO (1) WO2020175163A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170177557A1 (en) 2015-12-21 2017-06-22 Xerox Corporation Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions
JP2018010489A (en) 2016-07-13 2018-01-18 日本電信電話株式会社 Logical relation recognition device, logical relation recognition method and logical relation recognition program
WO2019026147A1 (en) 2017-07-31 2019-02-07 株式会社Pfu Information processing device, information processing system, control method, and control program

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003233516A (en) * 2002-02-08 2003-08-22 Comax Inc Database, computer readable program, database management system, new registration method for database, retrieving method in database, and update registration method for database
JP3878518B2 (en) * 2002-07-08 2007-02-07 松下電器産業株式会社 Data retrieval device
JP4973063B2 (en) * 2006-08-14 2012-07-11 富士通株式会社 Table data processing method and apparatus
JP2008108114A (en) * 2006-10-26 2008-05-08 Just Syst Corp Document processor and document processing method
CN101276412A (en) * 2007-03-30 2008-10-01 夏普株式会社 Information processing system, device and method
JP5556524B2 (en) * 2010-09-13 2014-07-23 株式会社リコー Form processing apparatus, form processing method, form processing program, and recording medium recording the program
JP2012194879A (en) * 2011-03-17 2012-10-11 Pfu Ltd Information processing apparatus, information processing method and program
JP6109688B2 (en) * 2013-09-06 2017-04-05 株式会社東芝 Form reader and program
CN111767953B (en) * 2020-06-30 2021-11-26 北京字节跳动网络技术有限公司 Method and apparatus for training an article coding model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170177557A1 (en) 2015-12-21 2017-06-22 Xerox Corporation Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions
JP2018010489A (en) 2016-07-13 2018-01-18 日本電信電話株式会社 Logical relation recognition device, logical relation recognition method and logical relation recognition program
WO2019026147A1 (en) 2017-07-31 2019-02-07 株式会社Pfu Information processing device, information processing system, control method, and control program

Also Published As

Publication number Publication date
US20220165077A1 (en) 2022-05-26
CN113508393A (en) 2021-10-15
EP3910546A1 (en) 2021-11-17
WO2020175163A1 (en) 2020-09-03
EP3910546A4 (en) 2022-10-05
JP2020140410A (en) 2020-09-03

Similar Documents

Publication Publication Date Title
US8713486B2 (en) High performance design rule checking technique
US10191889B2 (en) Systems, apparatuses and methods for generating a user interface by performing computer vision and optical character recognition on a graphical representation
US8407805B2 (en) Method and system for classifying and redacting segments of electronic documents
US8693790B2 (en) Form template definition method and form template definition apparatus
US10885325B2 (en) Information processing apparatus, control method, and storage medium
US8448097B2 (en) High performance DRC checking algorithm for derived layer based rules
KR101549792B1 (en) Apparatus and method for automatically creating document
JP2019204399A (en) Information processing device and program
KR102356909B1 (en) Annotation method of assigning object and setting object properties for learning data of artificial intelligence, and computer program recorded on record-medium for executing method thereof
CN108664471A (en) Text region error correction method, device, equipment and computer readable storage medium
US20220101643A1 (en) Information processing device, discerning method, and discerning program
KR102439429B1 (en) Annotation method for easy object extraction and a computer program recorded on a recording medium to execute the annotation method
JP4789589B2 (en) Layout method and apparatus
KR102433002B1 (en) Annotation method through multiple binding box selection and a computer program recorded on a recording medium to execute the same
JP7211157B2 (en) Information processing device, association method and association program
CN113704111A (en) Page automatic testing method, device, equipment and storage medium
CN112487437A (en) Android counterfeit application detection method and device based on user interface characteristics
CN113449732A (en) Information processing apparatus, image reading apparatus, recording medium, and information processing method
JP2018055256A (en) Information processing apparatus, information processing method, and program
US9437020B2 (en) System and method to check the correct rendering of a font
CN109598683A (en) Image display method, apparatus and computer readable storage medium
JP4967045B2 (en) Background discriminating apparatus, method and program
JP2007048061A (en) Character processing device, character processing method, and recording medium
JP7435020B2 (en) Information processing device and information processing program
JP2019153230A (en) Information processor and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221226

R150 Certificate of patent or registration of utility model

Ref document number: 7211157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150