JP2012068997A - Tabulation breakdown determination system and program - Google Patents
Tabulation breakdown determination system and program Download PDFInfo
- Publication number
- JP2012068997A JP2012068997A JP2010214398A JP2010214398A JP2012068997A JP 2012068997 A JP2012068997 A JP 2012068997A JP 2010214398 A JP2010214398 A JP 2010214398A JP 2010214398 A JP2010214398 A JP 2010214398A JP 2012068997 A JP2012068997 A JP 2012068997A
- Authority
- JP
- Japan
- Prior art keywords
- information
- total
- database
- breakdown
- aggregation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、帳票(帳票イメージデータ等)からデータ・情報(項目情報など)を抽出する情報処理システム等の技術に関する。特に、帳票(複数枚の規定帳票)から読み込まれた項目情報のうち、数値データを、明細・小計・合計などの項目(集計内訳)に自動的に判定する処理機能を持つシステム(集計内訳判定システム)等に関する。 The present invention relates to a technology such as an information processing system that extracts data / information (such as item information) from a form (such as form image data). In particular, among the item information read from forms (multiple forms), a system with a processing function that automatically determines numerical data as items (total breakdown) such as details, subtotals, and totals (total breakdown determination) System).
集計内訳判定システム等に係わる先行技術例として、特開2003−296705号公報(特許文献1)などがある。特許文献1(「項目定義情報抽出システム」等)では、「イメージ入力部から入力したカラーの帳票イメージデータから、オブジェクト色判定部は、色別のイメージ形態を抽出し、抽出したイメージ形態が、項目を構成するイメージ単位であるオブジェクトに施された色彩マークであると判断した場合に、色種を出力し、項目定義情報判定部は、オブジェクト毎に、色種に基づいて、項目定義情報に含まれる項目タイプを判定する」旨が記載されている。 JP-A 2003-296705 (Patent Document 1) and the like are examples of prior art related to a total breakdown determination system and the like. In Patent Literature 1 (“item definition information extraction system” or the like), “from the color form image data input from the image input unit, the object color determination unit extracts the image form for each color, and the extracted image form is When it is determined that it is a color mark applied to an object that is an image unit that constitutes an item, the color type is output, and the item definition information determination unit determines the item definition information based on the color type for each object. “Determine item type included”.
集計内訳判定システム等に係わる課題・問題点として、特許文献1でも述べられているように、項目タイプのように、帳票イメージデータに含まれる形態のみからでは判定しにくい情報が存在しその抽出等が難しいことが挙げられる。特許文献1の場合は、対象の色を判断して項目タイプを判定・抽出している。
As described in
例えば従来技術では、帳票イメージデータから抽出した情報をもとに帳票定義ファイル(帳票定義情報)を自動生成する場合、数値項目(数値データが格納されている項目)に関して、明細と合計が同じ数値項目として定義されてしまう。 For example, in the conventional technology, when a form definition file (form definition information) is automatically generated based on information extracted from the form image data, the numerical value (the item in which the numerical data is stored) is the same as the details for the numeric items (items storing the numeric data). It will be defined as an item.
以上に基づき、本発明の主な目的として、集計内訳判定システム等に係わり、規定帳票・帳票イメージデータ等から項目情報等を自動的に抽出して帳票定義ファイルを作成する過程において、抽出した情報に含まれている数値項目を、明細(明細項目)・小計(小計項目)・合計(合計項目)などの項目(集計内訳)に自動的に判定することができる処理機能(集計機能)を実現する。 Based on the above, as the main purpose of the present invention, the information extracted in the process of creating the form definition file by automatically extracting item information etc. from the specified form / form image data etc. Realizes a processing function (aggregation function) that can automatically determine the numeric items included in the item (detail item), subtotal (subtotal item), total (total item) and other items (aggregation breakdown) To do.
本発明の代表的な形態の概要は、規定帳票・帳票イメージデータ等から情報(項目定義情報など)を自動的に抽出・判定する情報処理システム(集計内訳判定システム)等であって、以下に示す構成を有することを特徴とする。 An outline of a typical form of the present invention is an information processing system (aggregation breakdown determination system) or the like that automatically extracts and determines information (item definition information, etc.) from specified forms / form image data, etc. It has the structure shown.
本システムは、帳票をもとに帳票定義情報を作成する過程で用いる情報を得る処理機能として、帳票から抽出される数値項目を明細・小計・合計の各項目(集計内訳)に自動的に判定し抽出する処理機能を有する。これにより、帳票定義情報に、合計情報を含む情報を設定可能となる。 This system automatically determines numerical items extracted from the form as detailed, subtotal, and total items (aggregation breakdown) as a processing function to obtain information used in the process of creating form definition information based on the form. And a processing function for extracting. As a result, information including total information can be set in the form definition information.
本システムは、1枚以上の規定帳票ないしそのイメージデータを入力して帳票項目情報を抽出して第1のデータベースに格納する入力処理部(帳票情報読込機能)と、前記第1のデータベース(取込情報DB)を用いて、集計内訳情報を含む、帳票定義ファイルの作成に用いる情報を得る集計機能と、前記集計機能により得た情報を用いて前記帳票定義ファイルを作成する出力処理部(帳票作成機能)と、を有する。 The system includes an input processing unit (form information reading function) that inputs one or more specified forms or image data thereof, extracts form item information, and stores the extracted form item information in the first database; And a summary function that obtains information used to create a form definition file that includes summary breakdown information, and an output processing unit that creates the form definition file using the information obtained by the summary function (form) Creation function).
前記集計機能は、前記第1のデータベースから、数値データを取り出し、集計対象情報として第2のデータベース(集計情報DB)に格納する、第1の処理部と、前記第1及び第2のデータベースから、集計単位を判別して抽出し、集計単位情報として第3のデータベース(集計単位DB)に格納する、第2の処理部(集計単位抽出処理部)と、前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている明細項目を判別し、当該明細項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第3の処理部(集計処理部)と、前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている小計項目を判別し、当該小計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第4の処理部(小計内訳処理部)と、前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている合計項目を判別し、当該合計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第5の処理部(合計内訳処理部)と、を有する。 The totaling function extracts numerical data from the first database and stores it in a second database (totaling information DB) as totaling target information, and from the first processing unit and the first and second databases A second processing unit (aggregation unit extraction processing unit) that identifies and extracts the aggregation unit and stores it in a third database (aggregation unit DB) as aggregation unit information; and the aggregation unit information of the third database A third processing unit that determines detailed items included in the aggregation target information of the second database and stores total breakdown information including the information of the detailed items in the second database (Total processing unit) and the total unit information of the third database are used to determine the subtotal items included in the target information of the second database and include information on the subtotal items Using the fourth processing unit (subtotal breakdown processing unit) that stores the total breakdown information in the second database and the total unit information of the third database, the total breakdown information is stored in the second database. A fifth processing unit (total breakdown processing unit) that discriminates the total items included and stores the total breakdown information including the information of the total items in the second database;
本発明の代表的な形態によれば、集計内訳判定システム等に係わり、規定帳票等から項目情報等を自動的に抽出して帳票定義ファイルを作成する過程において、抽出した情報に含まれている数値項目を、明細・小計・合計などの項目に自動的に判定することができる処理機能を実現する。本処理機能により、帳票定義ファイル(項目定義情報)に、合計情報(合計行)を含む集計内訳情報を設定・付加することができる。 According to a representative form of the present invention, it is related to a total breakdown determination system and the like, and is included in the extracted information in the process of automatically extracting item information from a specified form etc. and creating a form definition file. A processing function capable of automatically determining numerical items as items such as details, subtotals, and totals is realized. With this processing function, it is possible to set and add total breakdown information including total information (total lines) to the form definition file (item definition information).
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted.
[システム構成]
図1は、本発明の一実施の形態のシステム(集計内訳判定システム)の全体構成例を示している。本システムは、スキャナ101とサーバ102がネットワーク等で接続されている。スキャナ101は、ユーザ操作に基づき複数枚の規定帳票C1をスキャンして帳票イメージデータC2を得る。サーバ102は、集計機能103、帳票情報読込機能112、帳票作成機能113、等の処理機能を有する。各処理機能は、例えばソフトウェアプログラム処理(サーバ102のプロセッサがメモリ上の制御プログラムを実行する等)により実現される。
[System configuration]
FIG. 1 shows an example of the overall configuration of a system (aggregation breakdown determination system) according to an embodiment of the present invention. In this system, a
集計機能103は、集計対象抽出処理部104、集計単位抽出処理部105、集計処理部106、小計内訳処理部107、及び合計内訳処理部108と、取込情報DB109(第1のデータベース)、集計情報DB110(第2のデータベース)、及び集計単位DB111(第3のデータベース)とを有する。
The
本システムにおいて、スキャナ101から複数枚の規定帳票C1を帳票イメージデータC2として入力・読み込みし、サーバ102内の帳票情報読込機能112において、当該帳票イメージデータC2を変換処理により帳票項目情報D1などを抽出し、取込情報DB109に出力(格納)する。
In the present system, a plurality of specified forms C1 are input / read as form image data C2 from the
上記読み込み完了後、集計機能103内の集計対象抽出処理部104において、取込情報DB109から数値データD2を取り出し、集計対象情報D3として、集計情報DB110に出力(格納)する。次に、集計単位抽出処理部105は、取込情報DB109のデータ及び集計情報DB110のデータから、集計する単位(集計単位情報D4)を取り出し、取り出した集計単位情報D4を、集計単位DB111に出力(格納)する。そして、集計処理部106、小計内訳処理部107、及び合計内訳処理部108において、それぞれ、明細(d1)、小計(d2)、及び合計(d3)の項目を自動的に判別・抽出し、当該情報(d1〜d3)を、集計内訳情報として、集計情報DB110に出力(格納)する。
After the reading is completed, the aggregation target
上記処理後、帳票作成機能113は、取込情報DB109のデータ及び集計情報DB110のデータから、帳票定義ファイル(帳票定義情報)F1を自動的に作成する。帳票定義ファイルF1は、項目定義情報(例えば項目の名、タイプ、サイズ等の情報を含む)を含む。項目定義情報は、XML形式言語などにおいて有効利用される。上記により特に、合計項目(d3)の情報を含む帳票定義ファイルF1を得ることができる。
After the above processing, the
以下先に本システムの処理で用いる各種データ情報の例について説明する(図7〜図10)。その後、各処理詳細例について説明する(図2〜図6)。 Hereinafter, examples of various data information used in the processing of this system will be described (FIGS. 7 to 10). Then, each processing detailed example is demonstrated (FIGS. 2-6).
[取込情報DB]
図7は、取込情報DB109の構成例を示す。本テーブルの項目として、「ID」,「開始位置−横」,「開始位置−縦」,「終了位置−横」,「終了位置−縦」,「項目値」,「フォント」,「文字種類」,「固定/可変」を有する。
[Import Information DB]
FIG. 7 shows a configuration example of the
「ID」は、連番によるレコード識別子であり、帳票情報読込機能112で読み込んだ順である。「ID」は後述の「取込情報ID」となる。「開始位置−横」(Xa),「開始位置−縦」(Ya)は、項目の開始位置(横軸(X),縦軸(Y))を示す。「終了位置−横」(Xb),「終了位置−縦」(Yb)は、項目の終了位置(横軸(X),縦軸(Y))を示す。「項目値」は、項目の文字列や数値などの値であり、例えば“帳票名”,“タイトル”,“aaa”,“1”等がある。「フォント」は、項目値のフォントであり、例えば明朝、ゴシック等である。「文字種類」は、項目値における文字列と数値との区別を示す。「固定/可変」は、項目値が固定値か可変値かを区別・管理する。
“ID” is a record identifier by serial number, and is the order read by the form
[集計情報DB]
図8は、集計情報DB110の構成例を示す。本テーブルの項目として、「ID」,「集計フラグ」,「集計先ID」を有する。「ID」は、取込情報DB109の「ID」に対応した値が設定される(同じID値は同じ項目を示す)。「ID」は後述の「集計情報ID」となる。「集計フラグ」は、値“1”が集計処理対象であることを示し、値“0”が集計処理対象外であることを示す。「集計フラグ」の初期値は“1”であり、プロパティ変更可能である。「集計先ID」は、集計先のIDを示す。「集計先ID」の初期値は空白であり、合計(合計項目)の場合は“0”を設定し、集計処理対象外(フラグ値“0”)の場合は無し(“−”)とする。図8の例では、ID=6の項目(図7のID=6の項目値“1”(数値)に対応する)については、集計処理対象であり、集計先がID=29(合計項目)となっている。
[Aggregation information DB]
FIG. 8 shows a configuration example of the
[集計単位DB]
図9は、集計単位DB111の構成例を示す。本テーブルの項目として、「開始位置−横」(Xc),「終了位置−横」(Xd),「合計」,「最大値」,「最大値ID」を有する。Xcは項目(集計単位)の開始位置(横軸)を示し、Xdは項目(集計単位)の終了位置(横軸)を示す。「合計」は、項目値の合計を示す。「最大値」は、項目値の最大値を示す。「最大値ID」は、「最大値」のIDを示す。
[Aggregation unit DB]
FIG. 9 shows a configuration example of the aggregation unit DB 111. The items in this table include “start position—horizontal” (Xc), “end position—horizontal” (Xd), “total”, “maximum value”, and “maximum value ID”. Xc indicates the start position (horizontal axis) of the item (aggregation unit), and Xd indicates the end position (horizontal axis) of the item (aggregation unit). “Total” indicates the total of the item values. “Maximum value” indicates the maximum value of the item value. “Maximum value ID” indicates an ID of “maximum value”.
[規定帳票]
図10は、規定帳票C1のサンプルを示す。1枚目の“帳票名1”、及び2枚目の“帳票名2”の各帳票において、項目として、「タイトル1」「タイトル2」「タイトル3」を有し、図示するように各行に文字列や数値が格納されている。
[Regulation form]
FIG. 10 shows a sample of the specified form C1. Each form of “
[集計対象抽出処理]
図2は、集計対象抽出処理部104における集計対象抽出処理の動作を示す(Sは処理ステップを表す)。以下処理主体は104である。
[Aggregate target extraction process]
FIG. 2 shows the operation of the aggregation target extraction process in the aggregation target extraction processing unit 104 (S represents a processing step). The processing entity is 104 hereinafter.
まず、S201では、集計情報DB110にデータが存在するかどうかを判定する。存在しない場合(N)、S202では、取込情報DB109から、所定の取り出し条件を満たすデータ(数値データD2)を取り出す。取り出し条件は、取込情報DB109のデータの『文字種類=数値』(文字種類が数値であること)である。取り出しの順序については指定無しとする。この際、本処理のために、取込情報DB109のデータの「ID」を、「取込情報ID」とおく。
First, in S201, it is determined whether or not data exists in the
次にS204では、S202で取り出したデータ(D2)を元に集計情報DB110に集計対象情報D3を登録する(取り出したデータに初期値を設定して登録する)。この際、集計情報DB110への登録値として、「ID」は上記「取込情報ID」とし、「集計先フラグ」=1とし、「集計先ID」=空白とする。
Next, in S204, the aggregation target information D3 is registered in the
S206では、取込情報DB109のデータに関して、終わりかどうかを判別し、終わりではない場合(N)、次のデータについて、S202以降の処理を同様に繰り返し行う。終わりの場合(Y)、本集計対象抽出処理が完了となる。
In S206, it is determined whether or not the data of the
前記S201で集計情報DB110にデータが存在する場合(Y)、S203では、集計情報DB110から、所定の取り出し条件を満たすデータ(D2)を取り出す。取り出し条件は、『集計情報DB110の『集計先フラグ=1』かつ『集計先ID≠−』(集計先IDがマイナスではないこと)』である。取り出しの順序については指定無しとする。この際、集計情報DB110のデータの「ID」を、「集計情報ID」とおく。
When data is present in the
S205では、S203で取り出したデータ(D2)を元に集計情報DB110を更新する(取り出したデータに初期値を設定して登録情報を更新する)。この際、更新条件は、『集計情報DB110の「ID」=「集計情報ID」』である。また集計情報DB110への更新値として、「集計先フラグ」=1とし、「集計先ID」=空白とする。
In S205, the
S207では、集計情報DB110のデータに関して、終わりかどうかを判別する。終わりではない場合(N)、次のデータについて、S203以降の処理を同様に繰り返し行う。終わりの場合(Y)、本集計対象抽出処理が完了となる。
In S207, it is determined whether or not the data in the
以上の処理により、帳票の集計対象となりうる数値データD2(集計対象情報D3)を収集することが可能となる。 Through the above processing, it is possible to collect numerical data D2 (aggregation target information D3) that can be the aggregation target of the form.
[集計単位抽出処理]
図3は、集計単位抽出処理部105における集計単位抽出処理の動作を示す。以下処理主体は105である。
[Aggregation unit extraction processing]
FIG. 3 shows the operation of the total unit extraction processing in the total unit
まず、S301では、集計単位DB111の全データを削除する。S302では、集計情報DB110からデータ(集計対象情報D3)を取り出す。取り出し条件は無し、及び取り出し順序は指定無しである。この際、集計情報DB110の「ID」を「集計情報ID」とおき、集計情報DB110の「集計フラグ」をそのまま本処理で用いる「集計フラグ」とおく。
First, in S301, all data in the tabulation unit DB 111 is deleted. In S302, data (aggregation target information D3) is extracted from the
S303では、「集計フラグ」=1(集計処理対象)かどうかを判別する。1である場合(Y)、S304では、取込情報DB109から、取り出し条件として、『取込情報DB109の「ID」=「集計情報ID」』を満たすデータを取り出す。取り出し順序は指定無しである。この際、取込情報DB109の「ID」を「取込情報ID」とおき、取込情報DB109の「開始位置-横」(Xa)を「取込開始位置-横」(Xe)とおき、取込情報DB109の「終了位置-横」(Xb)を「取込終了位置-横」(Xf)とおき、取込情報DB109の「項目値」をそのまま「項目値」とおく。
In S303, it is determined whether or not “total flag” = 1 (total processing target). If it is 1 (Y), in S304, data satisfying “ID of the
S305では、集計単位DB111から、取り出し条件として、『集計単位DB111の「開始位置-横」(Xc)=「取込開始位置-横」(Xe)』かつ『集計単位DB111の「終了位置-横」(Xd)=「取込終了位置-横」(Xf)』を満たすデータを取り出す。取り出し順序は指定無しである。この際、集計単位DB111の「合計」をそのまま「合計」とおき、集計単位DB111の「最大値」をそのまま「最大値」とおき、集計単位DB111の「最大値ID」をそのまま「最大値ID」とおく。
In
S306では、データが存在したかどうかを判別する。存在した場合(Y)、S308にて、「項目値」≧「最大値」かどうかを判別する。「項目値」≧「最大値」の場合(Y)、S309では、集計単位DB111を更新する。この際、更新条件として、『集計単位DB111の「開始位置-横」(Xc)=「取込開始位置-横」(Xe)、かつ、集計単位DB111の「終了位置-横」(Xd)=「取込終了位置-横」(Xf)』とする。また、更新値として、合計=合計+項目値(合計に項目値を加算する)とし、最大値=項目値(最大値を項目値と同じにする)とし、最大値ID=集計情報ID(最大値IDを集計情報IDと同じにする)とする。 In S306, it is determined whether data exists. If it exists (Y), in S308, it is determined whether “item value” ≧ “maximum value”. When “item value” ≧ “maximum value” (Y), in S309, the aggregation unit DB 111 is updated. At this time, the update condition is “start position—horizontal” (Xc) = “start position—horizontal” (Xe) of the total unit DB 111 and “end position—horizontal” (Xd) = “Capture end position—horizontal” (Xf) ”. Also, as update values, total = total + item value (add item value to total), maximum value = item value (maximum value is the same as item value), maximum value ID = total information ID (maximum The value ID is the same as the total information ID).
前記S308で「項目値」<「最大値」の場合(N)、S310では、集計単位DB111を更新する処理を行い、S311以降の処理を行う。S310の際、更新条件としては、『集計単位DB111の「開始位置-横」(Xc)=「取込開始位置-横」(Xe)、かつ、「終了位置-横」(Xd)=「取込終了位置-横」(Xf)』である。また、更新値としては、合計=合計+項目値とする。 When “item value” <“maximum value” in S308 (N), in S310, the process of updating the aggregation unit DB 111 is performed, and the processes after S311 are performed. At the time of S310, update conditions are: “Start position—horizontal” (Xc) = “Start position—horizontal” (Xe) and “End position—horizontal” (Xd) = “take” "End position-horizontal" (Xf) ". Further, the update value is set to sum = total + item value.
S311では、終わりかどうかを判別し、終わりの場合(Y)、本集計単位抽出処理が完了となる。終わりではない場合(N)、次のデータについて、S302以降の処理を同様に繰り返し行う。 In S311, it is determined whether or not it is the end, and in the case of the end (Y), the total unit extraction processing is completed. When it is not the end (N), the process after S302 is similarly repeated about the following data.
前記S306でデータが存在しない場合(N)、S307で、集計単位DB111を登録する処理を行い、S311以降の処理を行う。S307の際、集計単位DB111への登録値として、「開始位置-横」(Xc)=「取込開始位置-横」(Xe)とし、「終了位置-横」(Xd)=「取込終了位置-横」(Xf)とし、「合計」=「項目値」とし、「最大値」=「項目値」とし、「最大値ID」=「集計情報ID」とする。 When there is no data in S306 (N), in S307, the process of registering the aggregation unit DB 111 is performed, and the processes after S311 are performed. At the time of S307, the registered values in the total unit DB 111 are “start position−horizontal” (Xc) = “capture start position−horizontal” (Xe), and “end position−horizontal” (Xd) = “capture end” Position-horizontal (Xf), “total” = “item value”, “maximum value” = “item value”, and “maximum value ID” = “total information ID”.
以上(図3)の処理により、集計単位(集計単位情報D4)を収集することが可能となる。 Through the processing described above (FIG. 3), it is possible to collect a total unit (total unit information D4).
[集計処理]
図4は、集計処理部106における集計処理の動作を示す。以下処理主体は106である。
[Aggregation process]
FIG. 4 shows the operation of aggregation processing in the
まず、S401では、集計処理内の変数を初期化する。変数であるエラーフラグに0を設定する。S402では、集計単位DB111からデータ(集計単位情報D4)を取り出す。取り出し条件は無し、及び取り出し順序の指定無しである。この際、集計単位DB111の「開始位置-横」(Xc)を「集計開始位置-横」(Xg)とおき、集計単位DB111の「終了位置-横」(Xd)を「集計終了位置-横」(Xh)とおき、集計単位DB111の「合計」をそのまま「合計」とおき、集計単位DB111の「最大値」をそのまま「最大値」とおき、集計単位DB111の「最大値ID」をそのまま「最大値ID」とおく。 First, in S401, variables in the aggregation process are initialized. Set the error flag, which is a variable, to 0. In S402, data (aggregation unit information D4) is extracted from the aggregation unit DB 111. There is no take-out condition and no take-out order is specified. At this time, “start position—horizontal” (Xc) of the aggregation unit DB 111 is set to “aggregation start position—horizontal” (Xg), and “end position—horizontal” (Xd) of the aggregation unit DB 111 is set to “aggregation end position—horizontal”. "(Xh)", "Total" in the aggregation unit DB 111 is left as "Total", "Maximum value" in the aggregation unit DB 111 is left as "Maximum value", and "Maximum value ID" in the aggregation unit DB 111 is left as it is. It is set as “maximum value ID”.
S403では、集計情報DB111を更新する。更新条件として、『「ID」=「最大値ID」』とする。また、更新値として、「集計先ID」=0とする。 In S403, the total information DB 111 is updated. As an update condition, ““ ID ”=“ maximum value ID ”” is set. In addition, “aggregation destination ID” = 0 is set as the update value.
S404では、『最大値×3=合計』かどうかを判別する。判別でYESの場合(Y)、S405では、小計内訳処理(小計内訳処理部107による処理)を呼び出す。この際、引数は、「集計開始位置-横」(Xg)、「集計終了位置-横」(Xh)とし、戻り値は、エラーフラグとする。 In S404, it is determined whether or not “maximum value × 3 = total”. If the determination is YES (Y), in S405, a subtotal breakdown process (process by the subtotal breakdown processing unit 107) is called. At this time, the argument is “total start position—horizontal” (Xg) and “total count end position—horizontal” (Xh), and the return value is an error flag.
上記判別でNOの場合(N)、S406では、合計内訳処理(合計内訳処理部108による処理)を呼び出す。この際、引数は、「集計開始位置-横」(Xg)、「集計終了位置-横」(Xh)、「最大値ID」、「合計」とする。戻り値は、エラーフラグとする。 When the determination is NO (N), in S406, the total breakdown process (process by the total breakdown processing unit 108) is called. In this case, the arguments are “counting start position—horizontal” (Xg), “totaling position—horizontal” (Xh), “maximum value ID”, and “total”. The return value is an error flag.
S407では、終わりかどうかを判別する。終わりではない場合(N)、次のデータについて、S402以降の処理を同様に繰り返し行う。終わりの場合(Y)、S408では、エラーフラグ=1かどうかを判別する。1ではない場合(N)、本集計処理が完了となる。1の場合(Y)、S409では、集計対象抽出処理(集計対象抽出処理部104による処理)を呼び出し、本集計処理が完了となる。 In S407, it is determined whether or not the end. When it is not the end (N), the process after S402 is similarly repeated about the following data. In the case of the end (Y), in S408, it is determined whether or not the error flag = 1. When it is not 1 (N), this totaling process is completed. In the case of 1 (Y), in S409, the aggregation target extraction process (process by the aggregation target extraction processing unit 104) is called, and the total aggregation process is completed.
以上(図4)の処理により、集計単位毎に、明細、小計、及び合計を自動的に判別することができる。 With the above processing (FIG. 4), details, subtotals, and totals can be automatically determined for each aggregation unit.
[小計内訳処理]
図5は、小計内訳処理部107における小計内訳処理の動作を示す。以下処理主体は107である。開始時の引数は、「集計開始位置−横」(Xg)、「集計終了位置−横」(Xh)である。
[Subtotal breakdown processing]
FIG. 5 shows the operation of subtotal breakdown processing in the subtotal
ます、S501では、小計内訳処理内の変数を初期化する。変数である、「小計ID」、「小計ID項目値」、「小計」、及び「小計内訳エラーフラグ」に、0を設定する。 First, in S501, variables in the subtotal breakdown process are initialized. “0” is set to the variables “subtotal ID”, “subtotal ID item value”, “subtotal”, and “subtotal breakdown error flag”.
S502では、取込情報DB109から、取り出し条件として、『取込情報DB109の「開始位置-横」(Xa)=「集計開始位置-横」(Xg)、かつ、取込情報DB109の「終了位置-横」(Xb)=「集計終了位置-横」(Xh)、かつ、取込情報DB109の「集計先ID」≠0』を満たすデータを取り出す。取り出し順序は、IDの降順とする。この際、取込情報DB109の「ID」を「取込情報ID」とおき、取込情報DB109の「項目値」を「取込項目値」とおく。
In S502, as the extraction condition from the
S503では、「小計ID」≠0かどうかを判別する。0の場合(N)、S505では、取り出したデータを小計として変数に値を設定し、次のデータについて、S502以降の処理を繰り返し行う。この際、「小計ID」=「取込情報ID」とし、「小計ID項目値」=「取込項目値」とし、「小計」=0とする。 In S503, it is determined whether or not “subtotal ID” ≠ 0. In the case of 0 (N), in S505, the extracted data is set as a subtotal, a value is set in the variable, and the processing after S502 is repeated for the next data. At this time, “subtotal ID” = “capture information ID”, “subtotal ID item value” = “capture item value”, and “subtotal” = 0.
前記S503で、0ではない場合(Y)、S504では、取込項目値を小計に加算する。即ち、「小計」=「小計」+「取込項目値」とする。 In S503, when it is not 0 (Y), in S504, the acquisition item value is added to the subtotal. That is, “subtotal” = “subtotal” + “capture item value”.
S506では、集計情報DB110を更新する。更新条件として、『「ID」=「取込情報ID」』である。また、更新値として、「集計先ID」=「小計ID」とする。
In S506, the
S507では、「小計ID項目値」=「小計」かどうかを判別する。YESの場合(Y)、S508では、小計内訳処理内の変数を初期化する。即ち、「小計ID」、「小計ID項目値」、及び「小計」に、0を設定する。NOの場合(N)、S509へ進む。 In S507, it is determined whether or not “subtotal ID item value” = “subtotal”. If YES (Y), in S508, variables in the subtotal breakdown process are initialized. That is, 0 is set to “subtotal ID”, “subtotal ID item value”, and “subtotal”. If NO (N), the process proceeds to S509.
S509では、終わりかどうかを判別する。終わりではない場合(N)、次のデータについて、S502以降の処理を同様に繰り返し行う。終わりの場合(Y)、S510では、「小計ID」≠0かどうかを判別する。0ではない場合(Y)、S511では、小計内訳エラーフラグに1を設定する。そして、戻り値である小計内訳エラーフラグを呼び出し元に返し、本小計内訳処理が完了となる。S510で0の場合(N)、戻り値である小計内訳エラーフラグを呼び出し元に返し、本小計内訳処理が完了となる。 In S509, it is determined whether or not the end. If it is not the end (N), the processing from S502 onward is repeated in the same manner for the next data. In the case of the end (Y), in S510, it is determined whether or not “subtotal ID” ≠ 0. If it is not 0 (Y), 1 is set to the subtotal breakdown error flag in S511. Then, a subtotal breakdown error flag as a return value is returned to the caller, and this subtotal breakdown processing is completed. If S510 is 0 (N), a subtotal breakdown error flag as a return value is returned to the caller, and this subtotal breakdown processing is completed.
以上(図5)の処理により、集計単位の明細、小計、及び合計を自動的に判別することができる。 With the above processing (FIG. 5), it is possible to automatically determine the details, subtotal, and total of the total unit.
[合計内訳処理]
図6は、合計内訳処理部108における合計内訳処理の動作を示す。以下処理主体は108である。開始時の引数は、「集計開始位置−横」(Xg)、「集計終了位置−横」(Xh)、「最大値ID」、「合計」である。
[Total breakdown processing]
FIG. 6 shows the operation of the total breakdown processing in the total
まず、S601では、合計内訳処理内の変数を初期化する。変数である、「項目値合計」、及び「合計内訳エラーフラグ」に、0を設定する。S602では、取込情報DB109から、取り出し条件として、『取込情報DB109の「開始位置-横」(Xa)=「集計開始位置-横」(Xg)、かつ、取込情報DB109の「終了位置-横」(Xb)=「集計終了位置-横」(Xh)、かつ、取込情報DB109の「集計先ID」≠0』を満たすデータを取り出す。取り出し順序は、IDの降順とする。この際、取込情報DB109の「ID」を「取込情報ID」とおき、取込情報DB109の「項目値」を「取込項目値」とおく。
First, in S601, variables in the total breakdown process are initialized. “0” is set in the variables “total item value” and “total breakdown error flag”. In S <b> 602, from the
S603では、「取込項目値」を「項目値合計」に加算する。即ち、「項目値合計」=「項目値合計」+「取込項目値」である。 In S603, “take-in item value” is added to “item value total”. That is, “total item value” = “total item value” + “import item value”.
S604では、集計情報DB110を更新する。この際、更新条件は、『「ID」=「取込情報ID」である。また、更新値として、「集計先ID」=「最大値ID」とする。
In S604, the
S605では、終わりかどうかを判断し、終わりではない場合(N)、次のデータについて、S602以降の処理を同様に繰り返し行う。S605で終わりの場合(Y)、S606では、『項目値合計×2≠合計』かどうかを判断する。YESの場合(Y)、S607では、合計内訳エラーフラグに1を設定する。そして、戻り値である合計内訳エラーフラグを呼び出し元に返し、本合計内訳処理が完了となる。S606でNOの場合(N)、戻り値である合計内訳エラーフラグを呼び出し元に返し、本合計内訳処理が完了となる。 In S605, it is determined whether or not it is the end, and if it is not the end (N), the processing after S602 is repeated in the same manner for the next data. If the process ends in S605 (Y), it is determined in S606 whether or not “total item value × 2 ≠ total”. If YES (Y), 1 is set to the total breakdown error flag in S607. Then, a total breakdown error flag as a return value is returned to the caller, and this total breakdown processing is completed. If NO in S606 (N), a total breakdown error flag as a return value is returned to the caller, and this total breakdown processing is completed.
以上(図6)の処理により、集計単位の明細、合計を自動的に判別することができる。 With the processing described above (FIG. 6), the details and totals of the counting units can be automatically determined.
[効果等]
以上説明したように、本実施の形態のシステムによれば、規定帳票C1・帳票イメージデータC2から項目情報等を自動的に抽出して帳票定義ファイルF1を作成する過程において、抽出した情報に含まれている数値項目(数値データD2)を、明細(d1)・小計(d2)・合計(d3)などの項目に自動的に判定することができる処理機能(集計機能103)を実現している。本処理機能により、帳票定義ファイルF1(項目定義情報)に、合計(d3)の情報(合計行)を含む集計内訳情報を設定・付加することができる。
[Effects]
As described above, according to the system of the present embodiment, in the process of automatically extracting item information from the specified form C1 and form image data C2 and creating the form definition file F1, it is included in the extracted information. The processing function (aggregation function 103) that can automatically determine the numerical item (numerical data D2) that has been recorded as items such as details (d1), subtotal (d2), and total (d3) is realized. . With this processing function, it is possible to set and add aggregate breakdown information including information (total line) of the total (d3) to the form definition file F1 (item definition information).
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
本発明は、会計システム等に利用可能である。 The present invention can be used for an accounting system or the like.
101…スキャナ、102…サーバ、103…集計機能、104…集計対象抽出処理部、105…集計単位抽出処理部、106…集計処理部、107…小計内訳処理部、108…合計内訳処理部、109…取込情報DB、110…集計情報DB、111…集計単位DB、112…帳票情報読込機能、113…帳票作成機能。
DESCRIPTION OF
Claims (2)
1枚以上の規定帳票ないしそのイメージデータから抽出される帳票項目情報が格納される第1のデータベースを用いて、集計内訳情報を含む、帳票定義ファイルの作成に用いる情報を得る集計機能を有し、
前記集計機能は、
前記第1のデータベースから、数値データを取り出し、集計対象情報として第2のデータベースに格納する、第1の処理部と、
前記第1及び第2のデータベースから、集計単位を判別して抽出し、集計単位情報として第3のデータベースに格納する、第2の処理部と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている明細項目を判別し、当該明細項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第3の処理部と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている小計項目を判別し、当該小計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第4の処理部と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている合計項目を判別し、当該合計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第5の処理部と、を有すること、を特徴とする集計内訳判定システム。 A summary breakdown determination system that performs information processing to extract information from a form and determine a breakdown breakdown,
Using a first database in which one or more specified forms or form item information extracted from the image data is stored, has a totaling function for obtaining information used to create a form definition file including totalization information ,
The aggregation function is
A first processing unit for extracting numerical data from the first database and storing the numerical data in the second database as aggregation target information;
A second processing unit that discriminates and extracts a counting unit from the first and second databases, and stores it in a third database as counting unit information;
Using the aggregation unit information of the third database, the detailed items included in the aggregation target information of the second database are discriminated, and the aggregated breakdown information including the information of the detailed items is determined as the second database. A third processing unit to be stored in
Using the total unit information of the third database, the subtotal item included in the target information of the second database is determined, and the total breakdown information including the information of the subtotal item is determined as the second database. A fourth processing unit stored in
The total item included in the target information of the second database is determined using the total unit information of the third database, and the total breakdown information including the information of the total item is determined as the second database. And a fifth processing unit stored in the total breakdown determination system.
1枚以上の規定帳票ないしそのイメージデータから抽出される帳票項目情報が格納される第1のデータベースを用いて、集計内訳情報を含む、帳票定義ファイルの作成に用いる情報を得る集計処理を実行させ、
前記集計処理は、
前記第1のデータベースから、数値データを取り出し、集計対象情報として第2のデータベースに格納する、第1の処理と、
前記第1及び第2のデータベースから、集計単位を判別して抽出し、集計単位情報として第3のデータベースに格納する、第2の処理と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている明細項目を判別し、当該明細項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第3の処理と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている小計項目を判別し、当該小計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第4の処理と、
前記第3のデータベースの集計単位情報を用いて、前記第2のデータベースの集計対象情報に含まれている合計項目を判別し、当該合計項目の情報を含む集計内訳情報を、前記第2のデータベースに格納する、第5の処理と、を実行させること、を特徴とする集計内訳判定プログラム。 A summary breakdown determination program for causing a computer to execute information processing for extracting information from a form and determining a summary breakdown,
Using a first database in which one or more specified forms or form item information extracted from the image data is stored, a totaling process for obtaining information used to create a form definition file including totalization information is executed. ,
The aggregation process is as follows:
A first process of extracting numerical data from the first database and storing it in a second database as aggregation target information;
A second process of discriminating and extracting a total unit from the first and second databases and storing it in a third database as total unit information;
Using the aggregation unit information of the third database, the detailed items included in the aggregation target information of the second database are discriminated, and the aggregated breakdown information including the information of the detailed items is determined as the second database. A third process stored in
Using the total unit information of the third database, the subtotal item included in the target information of the second database is determined, and the total breakdown information including the information of the subtotal item is determined as the second database. A fourth process stored in
The total item included in the target information of the second database is determined using the total unit information of the third database, and the total breakdown information including the information of the total item is determined as the second database. And a fifth processing to be stored, and a total breakdown determination program characterized by:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010214398A JP2012068997A (en) | 2010-09-24 | 2010-09-24 | Tabulation breakdown determination system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010214398A JP2012068997A (en) | 2010-09-24 | 2010-09-24 | Tabulation breakdown determination system and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012068997A true JP2012068997A (en) | 2012-04-05 |
Family
ID=46166173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010214398A Pending JP2012068997A (en) | 2010-09-24 | 2010-09-24 | Tabulation breakdown determination system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012068997A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427599A (en) * | 2019-06-06 | 2019-11-08 | 北京辰森世纪科技股份有限公司 | The statistical method and device of report subtotal, storage medium, electronic device |
-
2010
- 2010-09-24 JP JP2010214398A patent/JP2012068997A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427599A (en) * | 2019-06-06 | 2019-11-08 | 北京辰森世纪科技股份有限公司 | The statistical method and device of report subtotal, storage medium, electronic device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9213893B2 (en) | Extracting data from semi-structured electronic documents | |
US10019535B1 (en) | Template-free extraction of data from documents | |
CN102239468A (en) | Visualizing relationships between data elements and graphical representations of data element attributes | |
JP2014137739A (en) | Information processor, information processing method and program | |
JP2008515061A (en) | A method for searching data elements on the web using conceptual and contextual metadata search engines | |
JP2019159898A (en) | Computer and template management method | |
JP2012198684A (en) | Information processing device, business form type estimation method, and business form type estimation program | |
JP6623754B2 (en) | Tabular data processing program, method and apparatus | |
CN112131220B (en) | Data report processing method and device | |
JP5702342B2 (en) | Receipt definition data creation device and program | |
JPWO2011148565A1 (en) | Database, management server, and management program | |
CN105808518A (en) | Data form filling system based on browser plug-in and integrating method thereof | |
JP2021033325A (en) | Image processing device, control method thereof and program | |
JP2010015458A (en) | Program correction support system, program correction support method, and program correction support program | |
JPWO2009048149A1 (en) | Electronic document equivalence judgment system and equivalence judgment method | |
JP2012068997A (en) | Tabulation breakdown determination system and program | |
CN103020095B (en) | Message processing device and information processing method | |
JP5064791B2 (en) | Form data search device, form data search method and program | |
JP6670051B2 (en) | Information processing apparatus, information processing method, and program | |
CN111984657B (en) | Data collection method, device, storage medium and computer equipment | |
JP5671676B2 (en) | Document data conversion apparatus and document conversion program | |
JP2002342547A (en) | System and program for public-service corporation accounting processing | |
JP2014134920A (en) | Design document retrieval system, construction method of design document retrieval system and program therefor | |
CN113901046A (en) | Virtual dimension table construction method and device | |
JP5998835B2 (en) | Information processing apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20111227 |