JP2006171800A

JP2006171800A - データ集計装置、その方法、及びプログラム

Info

Publication number: JP2006171800A
Application number: JP2004358947A
Authority: JP
Inventors: Masahiko Nagata; 真彦永田; Masataku Matsuura; 正卓松浦; Koichi Imamura; 浩一今村; Nobuyuki Takebe; 信幸武部; Norimasa Koike; 訓正小池; Junichi Wakao; 淳一若生
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2004-12-10
Filing date: 2004-12-10
Publication date: 2006-06-29
Also published as: US20060129515A1

Abstract

【課題】複数のアプリケーションにより蓄積されたファイル（データ）から必要なデータを自動的に取得するための技術を提供する。
【解決手段】マスタファイルＭから状態遷移テーブルである置換オートマトンＡを生成し、そのオートマトンＡを用いて、マスタファイルＭ、ジャーナルファイルＭから必要なデータを抽出してまとめたテンポラリファイルＴを生成する。ＴＲＩＥ構造の統計ヒドラＨは、集計条件ＳＣを参照して、テンポラリファイルＴから生成する。集計条件ＳＣで指定された操作は、統計ヒドラＨに存在するノードのなかで着目するノードを変更しながら行う。それによって得られた集計結果をまとめて集計結果ファイルＫを生成する。
【選択図】図３Ａ

Description

本発明は、一つ以上のファイルから必要なデータを抽出、或いは生成して別ファイルにまとめるための技術に関する。

企業などの組織では、業務をより効率的に行えるように、アプリケーション・プログラム（以下「アプリケーション」と略記）が広く用いられている。業務内容によってアプリケーションに要求される機能は異なる。このこともあって、組織の大部分は、多くのアプリケーションを用いている。

アプリケーションは通常、入力できるデータ（ファイル）、出力できるデータ（ファイル）を独自の立場で想定して開発される。このため、或るアプリケーションで出力されたデータ（ファイル）は別のアプリケーションでは扱えないのが普通である。このことから、組織のなかには、図１に示すように、データウェアハウス（ＤＷＨ）を構築したＤＷＨサーバを用意して、アプリケーション間のデータの受け渡しを可能とさせているところが存在する。図１中、それぞれ４つ示す「基幹業務システム」、及び「マートサーバ」はアプリケーションを搭載したデータ処理装置に相当する。例えばＰＯＳ（Point Of Sales）データやＨＨＴ（Hand Held Terminal）データなどは、基幹業務システムで蓄積されるデータに相当する。

ＤＷＨサーバは、各基幹業務システムのデータを格納したデータウェアハウスから抽出されるデータマートを各マートサーバに提供する。それにより、各基幹業務システムで生成・蓄積されたデータは、例えば図２に示すように各マートサーバに提供される。

データウェアハウスは、リレーショナル・データベース（ＲＤＢ）技術を前提としている。ＲＤＢでは、データ構造を表形式で表現する。各表は、アプリケーションとデータの独立性を高めるために、管理対象となる元データ（非正規化データ）の冗長性を極力排除し、関連性の強いデータだけをまとめるのが普通である。そのようにして、データを正規化することにより、データウェアハウスでは正規化されたデータのみを対象に処理を行わせるのが普通となっていた。

マートサーバ（アプリケーション）に必要なデータマートは随時、変更される。データウェアハウスでは、正規化したデータを対象とすることから、その変更に合わせた正規化を新たに行わなくてはならない。その変更により必要となる非正規化データを事前にデータクレンジング（形式統一、重複排除、など）しなければならない。

従来、そのデータクレンジングは、ＥＴＬ（Extract/Transform/Load）ツールなどを用いて行うようになっていた。そのため、データマートの変更に容易に対応できず、高いコストが掛かっていた。

データウェアハウスが管理するデータはアプリケーションにより生成されるものである。そのため、データマートの変更はアプリケーションのアップデートでも対応することができる。しかし、そのアップデートには、長い時間とコストが掛かるのが普通である。このことから、アプリケーションのアップデート等を行うことなく対応できるようにすることが重要であると考えられる。

データウェアハウスのなかには、１つのファイルを対象に、そのファイルに格納されているデータの操作を行うツールが用意されているものがある。しかし、図２に示すように、複数の基幹業務システムのデータを含んでいるデータマートは少なくないのが実情である。これは、その用意されたツールを利用できる状況は非常に限られていることを意味する。このことから、複数のファイルに対応できるようにすることは非常に重要であると考えられる。

複数のファイルへの対応は、複数のアプリケーションをサポートすることを意味する。複数のアプリケーションにより蓄積されたファイル（データ）から必要なデータを得られるようにすれば、一般的に高価なデータウェアハウス（ＲＤＢ）自体も不要にできると考えられる。
特開平１０−１０５５７６号公報特開平６−３０９３４３号公報

本発明は、複数のアプリケーションにより蓄積されたファイル（データ）から必要なデータを自動的に取得するための技術を提供することを目的とする。

本発明の第１の態様のデータ集計装置は、一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できるものであり、必要なデータの項目を示す項目情報を取得する情報取得手段と、情報取得手段が取得した項目情報を基に、一つ以上のファイルから必要なデータを抽出して別ファイルに格納するデータ併合手段と、を具備する。

なお、上記データ併合手段は、複数のファイルから必要なデータを抽出する場合、少なくとも一つのファイルに格納されている必要なデータから状態遷移テーブルを作成し、残りのファイルに格納されている必要なデータを該状態遷移テーブルにより抽出する、ことが望ましい。また、情報取得手段は、項目情報の他に、必要なデータを対象に行うべき操作を示す操作情報を取得することができ、データ併合手段は、情報取得手段が操作情報を取得した場合、項目情報を基に必要なデータを一時ファイルに格納し、該一時ファイルに格納した必要なデータを対象に該操作情報が示す操作を行い、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに別ファイルに格納する、ことが望ましい。

本発明の第２の態様のデータ集計装置は、複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できるものであり、データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する情報取得手段と、情報取得手段が取得した操作情報を基に、複数のファイルから操作の対象となるデータを抽出して操作を行う操作手段と、操作手段が操作を行うことにより得られたデータを別ファイルに出力するデータ出力手段と、を具備する。

本発明の第１の態様のデータ集計方法は、一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納するための方法であって、必要なデータの項目を示す項目情報を基に、一つ以上のファイルから必要なデータを抽出して別ファイルに格納するプログラムを用意し、プログラムに項目情報を与えて実行させることにより、一つ以上のファイルから必要なデータを抽出させて別ファイルに格納させる。

なお、上記プログラムは、項目情報の他に、必要なデータを対象に行うべき操作を示す操作情報に対応させ、そのプログラムに項目情報、及び操作情報を与えて実行させることにより、一つ以上のファイルから必要なデータを抽出させるとともに、該必要なデータを対象に該操作情報が示す操作を行わせ、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに別ファイルに格納させる、ことが望ましい。

また、そのプログラムとして、項目情報に対応させた第１のプログラム、及び操作情報に対応させた第２のプログラム、をそれぞれ用意し、第２のプログラムによる操作情報が示す操作は、第１のプログラムが生成するファイルに格納されたデータを対象に行わせる、ことが望ましい。

本発明の第２の態様のデータ集計方法は、複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納するための方法であって、データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を基に、複数のファイルから操作の対象となるデータを抽出して操作を行うプログラムを用意し、プログラムに操作情報を与えて実行させることにより、複数のファイルから操作の対象となるデータを抽出して操作を行わせ、該操作によって得られたデータを別ファイルに格納させる。

本発明の第１の態様のプログラムは、一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できるデータ集計装置に実行させることを前提とし、必要なデータの項目を示す項目情報を取得する機能と、取得する機能により取得した項目情報を基に、一つ以上のファイルから必要なデータを抽出して別ファイルに格納する機能と、を実現させる。

本発明の第２の態様のプログラムは、複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できるデータ集計装置に実行させることを前提とし、データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する機能と、取得する機能により取得した操作情報を基に、複数のファイルから操作の対象となるデータを抽出して操作を行う機能と、操作を行う機能によって操作を行うことにより得られたデータを別ファイルに出力する機能と、を実現させる。

本発明は、一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータの項目を示す項目情報を基に、一つ以上のファイルから必要なデータを自動的に抽出して別ファイルに格納する。そのため、複数のアプリケーションによって生成・蓄積されたファイルにそれぞれ格納させているデータであっても、そのなかで必要なデータを容易に得ることができる。必要なデータの変更は、項目情報の変更により容易に対応することができる。

本発明は、データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を基に、複数のファイルから操作の対象となるデータを自動的に抽出して操作を行い、その操作を行うことにより得られたデータを別ファイルに出力する。そのため、複数のアプリケーションによって生成・蓄積されたファイルにそれぞれ格納させているデータから必要なデータを容易に得ることができる。必要なデータの変更は、操作情報の変更により容易に対応することができる。

以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
図３Ａは、本実施の形態によるデータ集計装置が行う処理の概要を説明する図であり、図４は、そのデータ集計装置の構成を説明する図である。本実施の形態では、図４に示すように、集計装置１００はネットワークを介して接続された端末装置１０のユーザに対してサービスを提供するサーバーとして実現されている。

先ず、図３Ａを参照して、データ集計装置（以下「集計装置」と略記）１００が行う処理の概要について説明する。その図３Ａは、或る基幹業務システムで生成・蓄積されたジャーナルファイルＪ、及び業務の最も基本となるデータを格納しているマスタファイルＭから必要なデータを抽出する場合のものである。ジャーナルファイルＪには、ファクトデータが格納されている。各ファイルＪ、Ｍにそれぞれ格納されているデータは非正規化データである。

置換オートマトンＡは、１９８１年に発表された文字列照合エンジン・SIGMAで採用されたアルゴリズムを利用して生成される状態遷移テーブルである。その生成は、例えばマスタファイルＭに格納されたデータのなかで主キーとなるデータをスライスし、スライスしたデータを予め設定の操作情報に基づく変換後ＤＦＡ構造で表現することで行われる。そのようにして生成されるオートマトンは、複数のデータからなるデータ列の数が多くなってもデータ探査は一度のみ、すなわち検索時間は常に一定という特長を持っている。操作情報によるジャーナルファイルＪの主ノード指定機能により、１件のジャーナルレコードからデータ生成単位が繰り返し出現した場合には、その出現ノード単位にテンポラリレコードを生成する。

ジャーナルファイルＪ、マスタファイルＭから必要なデータを抽出する場合、先ず、マスタファイルＭから上述したようにして置換オートマトンＡを生成する（シーケンスＳ１）。そのオートマトンＡは、各枝葉の終端ノード部分には必要なデータ、即ち条件に合致したデータを格納する領域を確保して生成する。次に、ジャーナルファイルＪに格納されているファクトデータを先頭から最終まで逐次的に一方向に置換オートマトンＡに流す（シーケンスＳ２）。このとき置換オートマトンＡに格納されるファクトデータは指定の形式に置換される。そのファクトデータはそれぞれ、例えば１つのノードとして扱われる。その後、各ファイルＪ、Ｍのデータを置換して併合した形のテンポラリファイルＴを生成する（シーケンスＳ３）。

テンポラリファイルＴを生成すると、次に、そのファイルＴに格納されたデータを先頭から最終まで逐次的に読み込み、上記ＳＩＧＭＡアルゴリズムを利用してＴＲＩＥ構造Ｈを生成する（シーケンスＳ４）。そのＴＲＩＥ構造Ｈは、置換オートマトンＡの応用技術で生成される状態遷移テーブルである。集計条件ＳＣから特定される各枝葉の終端ノード部分には他のデータを格納する領域を確保している。図中、生成したＴＲＩＥ構造（状態遷移テーブル）Ｈは「統計ヒドラ」と表記している。以降、その表記を用いる。

上記集計条件ＳＣは、例えば統計処理の対象となるデータ、その内容を示すものである。統計処理としては、データ数のカウント、数値の合計、或いは最大値、若しくは最小値の抽出、などの操作が代表的なものである。統計ヒドラＨに確保した領域は、統計処理により得られるデータの格納に用いられる。

図３Ｂは、マスタファイルＭに格納されたデータ例を説明する図であり、図３Ｃは、そのマスタファイルＭ、及び集計条件ＳＣから作成される統計ヒドラＨの構成例を説明する図である。

図３Ｂに示すマスタファイルＭは、タグ「ＥＬＭ」、及び「ＩＤ」が配置されたルート要素「ＲＥＣ」をそれぞれレコードとして格納したものである。ここでは、各タグはそれぞれ項目に相当する。

図３Ｃに示す統計ヒドラＨは、タグ「ＥＬＭ」のデータ（図中「ＢＡＡ」等が相当）を主キーにして作成した場合のものである。図中の集計域は、統計処理用に確保した領域に相当する。図３Ｃに示すような集計域の確保は、集計条件ＳＣにより統計処理をタグ「ＥＬＭ」毎、及びそのタグ「ＥＬＭ」とタグ「ＩＤ」の組み合わせ毎にそれぞれ行うことを指定された場合に行われる。それにより、データが異なるタグ「ＥＬＭ」毎、及び何れかのデータが異なるタグ「ＥＬＭ」とタグ「ＩＤ」の組み合わせ毎に集計域が確保されている。

全てのレコードを対象にした統計処理を更に行う場合には、根に集計域が確保される。各集計域は遷移するノードの何れかに必ず存在することから、根に近いほうのノードでの統計処理結果はそれよりも遠いノードでの統計処理結果をまとめたものとすることができる。

統計ヒドラＨの生成後は、根から終端ノードに着目するノードを順次、移行させながら、集計条件ＳＣで指定された統計処理を行い、その統計処理により得られるデータを格納することにより、集計結果ファイルＫを生成する（シーケンスＳ５）。そのファイルＫが端末装置１０のユーザに提供される。

上述したようにして生成される集計結果ファイルＫは、ジャーナルファイルＪ、マスタファイルＭから抽出した必要なデータ、及び統計処理により得たデータを正規化してまとめたものである。図１では、マートサーバに与えるマートデータに相当する。そのため、データウェアハウスが用意されていなくとも、端末装置１０のユーザは複数の基幹業務システム（アプリケーション）でそれぞれ生成・蓄積されたファイルのデータを活用することができる。それらのファイルからのデータの抽出、及びそのデータを用いた統計処理は自動的に行われる。このため、それらのファイルのデータは容易に得ることができる。それにより、マートデータの変更などにも容易、且つ迅速に対応することができる。

次に、図４を参照して、上述したようにして集計結果ファイルＫを生成する集計装置１００の機能構成について詳細に説明する。
その集計装置１００には、図中、２００−１、２００−２、及び２００−ｎを付したデータ集計装置サブノード（以降「サブノード」と略記する）２００が複数、接続されている。図３Ａに概要を示す処理は、サブノード２００によって行われる。図４では、サブノード２００−１が有するジャーナルファイルには符号として「Ｊ１」を付すことにより、サブノード２００とそれが有するジャーナルファイルＪの関係を表している。これは、テンポラリファイルＴ、及び集計結果ファイルＫにおいても同様である。

端末装置１０のユーザは、データを抽出すべきファイル、そのデータの項目、抽出したデータに対して行うべき統計処理などを指定する集計命令を集計装置１００に通知して、集計結果ファイルＫの生成を行わせる。その集計命令は、ネットワークを介して集計装置１００に送信され、集計命令通知部１０２により各サブノード２００に送信される。ここでは混乱を避けるために、特に断らない限り、サブノード２００は一つのみを想定して以降の説明を行うこととする。

データ配布部１０１は、集計命令で指定されたジャーナルファイルＪをサブノード２００に送信する。そのファイルＪは、サブノード２００のデータ受取部２０１によって受信され、保存される。集計命令通知部１０２から送信された集計命令は、集計命令受取部２０２によって受信される。集計装置１００が管理、或いは取得したマスタファイルＭ１、Ｍｎは、例えば集計命令での指定に応じてサブノード２００に送信される。

サブノード２００のデータ併合置換部２０３は、集計命令受取部２００が受信した集計命令に従い、集計装置１００から送信されたジャーナルファイルＪ、マスタファイルＭから抽出すべきデータを抽出してテンポラリファイルＴを生成する。それにより、図３Ａに示すシーケンスＳ１〜３は、データ併合置換部２０３によって実現される。

集計命令受取部２０２が受信した集計命令の一部はデータ集計部２０４に送られる。その集計部２０４は、受け取った集計命令、及びテンポラリファイルＴから統計ヒドラＨ（図３Ｃ）を生成し、その集計命令で指定された統計処理を行うことにより集計結果ファイルＫを生成する。それにより、図３Ａに示すシーケンスＳ４、Ｓ５は、データ集計部２０４によって実現される。生成された集計結果ファイルＫは、集計結果通知部２０５によって集計装置１００に送信される。

集計装置１００には、集計命令を送信したサブノード２００からそれぞれ集計結果ファイルＫが送信される。集計装置１００の集計結果併合部１０３は、各サブノード２００から送信された集計結果ファイルＫを一つにまとめることで併合する。そのようにして得られた集計結果ファイルＫ、或いはそれについての情報は、集計結果応答部１０４によって端末装置１０に送信される。

このようにして、集計装置１００は、ネットワークを介して接続された端末装置１０のユーザに対し、そのユーザが必要とするデータを複数のファイルから抽出して提供するサービスを行う。

図５は、その集計装置１００を実現できるコンピュータのハードウェア構成の一例を示す図である。集計装置１００は複数のコンピュータ（データ処理装置）により実現させても良いが、ここでは図５に構成を示す１台のコンピュータによって実現されていることを前提として説明することとする。サブノード２００を含め、１台のコンピュータによって実現させても良い。

図５に示すコンピュータは、ＣＰＵ５１、メモリ５２、入力装置５３、出力装置５４、外部記憶装置５５、媒体駆動装置５６、及びネットワーク接続装置５７を有し、これらがバス５８によって互いに接続された構成となっている。同図に示す構成は一例であり、これに限定されるものではない。

ＣＰＵ５１は、コンピュータ全体を制御する中央処理装置である。
メモリ５２は、データを一時的に格納するＲＡＭ等のメモリである。外部記憶装置５５、若しくは媒体駆動装置５６がアクセスする可搬記録媒体ＭＤに記憶されているプログラム、あるいはデータが一時的に格納される。ＣＰＵ５１は、プログラムをメモリ５２に読み出して実行することにより、全体の制御を行う。

入力装置５３は、例えば、キーボード、マウス等の入力機器と接続されているか、或いはそれらを有するものである。そのような入力機器に対するユーザの操作を検出し、その検出結果をＣＰＵ５１に通知する。

出力装置５４は、例えばディスプレイと接続されているか、或いはそれを有するものである。ＣＰＵ５１の制御によって送られてくるデータをディスプレイ上に出力させる。
ネットワーク接続装置５７は、例えばイントラネットやインターネット等のネットワークを介して、他の装置と通信を行うためのものである。外部記憶装置５５は、例えばハードディスク装置である。主に各種データやプログラムの保存に用いられる。

記憶媒体駆動装置５６は、フレキシブル・ディスク、光ディスク（ここではＣＤ−ＲＯＭ、ＣＤ−Ｒ、及びＤＶＤ等を含む）、或いは光磁気ディスク等の可搬型の記録媒体ＭＤにアクセスするものである。

図４に示す集計装置１００を構成する各部１０１〜１０４は、例えば及びバス５８によって接続されたＣＰＵ５１、メモリ、外部記憶装置５５、及びネットワーク接続装置５７によって実現される。それらを有するコンピュータによってサブノード２００も実現させることができる。

次に、図６〜図１７に示す説明図を参照して、上記集計装置１００で行われる処理、及びその処理を行わせるための方法について具体的に説明する。
図６、及び図７は、マスタファイルＭのデータ構成を説明する図である。それらのファイルＭは、ＸＭＬ形式でデータを記述した場合のものである。タグ名「Ｍｓｔ１」「Ｍｓｔ２」の各要素はそれぞれ１レコードに相当する。以降、便宜的に、図６、及び図７にそれぞれ示すマスタファイルＭはマスタファイルＭ１、Ｍ２と表記する。

図８は、ジャーナルファイルＪのデータ構成を説明する図である。そのファイルＪも同様に、ＸＭＬ形式でデータを記述した場合のものである。タグ名「ｊｎｌ」の各要素はそれぞれ１レコードに相当する。

図９は、ジャーナルファイルＪの他のデータ構成を説明する図である。そのデータ構成は、図８に示すジャーナルファイルＪと同じ内容を別の方法で記述した場合のものである。レコードによって異なるデータはタグ名「ｍｅｉｓａｉ」の要素としてまとめられている。

図１０は、図６、図７にそれぞれ示すマスタファイルＭ１、Ｍ２、及び図８、或いは図９に示すジャーナルファイルＪから生成されるテンポラリファイルＴのデータ構成を説明する図である。

テンポラリファイルＴは、マスタファイルＭ、ジャーナルファイルＪとは異なり、ＣＳＶファイルとしている。そのファイルＴには、図１０に示すように、先頭行に項目ラベルが、２行目以降にデータがダブルクォーテーションで括りカンマ区切りで出力される。図１１は、ジャーナルファイルＪのレコード数がより多くなった場合のテンポラリファイルＴのデータ構成を説明する図である。

図１２は、図１１に示すテンポラリファイルＴから生成される集計結果ファイルＫのデータ構成を説明する図である。
図１２において、図１１に示されていない項目ラベル、つまり項目ラベル「ＶａｌＳＵＭ」「ＶａｌＭＡＸ」及び「ＣＴ」は統計処理により得たデータのものである。また、「−」が表記された行は、統計処理により得たデータを出力するために追加されたものである。

図１２に示す集計結果ファイルＫは図１１に示すテンポラリファイルＴから生成され、そのテンポラリファイルＴは、図６、図７にそれぞれ示すマスタファイルＭ１、Ｍ２、及び図８、或いは図９に示すジャーナルファイルＪから生成される。ここでは、図６、図７にそれぞれ示すマスタファイルＭ１、Ｍ２、及び図８、或いは図９に示すジャーナルファイルＪから図１１に示すテンポラリファイルＴを生成させ、更に図１２に示す集計結果ファイルＫを生成させる場合を例にとって、それらの生成を行わせるための方法について具体的に説明する。

本実施の形態では、テンポラリファイルＴ、集計結果ファイルＫの生成をそれぞれ独立して行えるようにしている。このことから、始めにテンポラリファイルＴを生成させる方法について具体的に説明する。

図１３は、テンポラリファイルＴを生成させるためのコマンド例を説明する図である。そのコマンドはＣ言語の形式で記述するようにしている。図１３中、「shunReplace.h」は、テンポラリファイルＴを生成するプログラム（関数）が格納されたファイルのファイル名、「xshun_GetReplace」はその関数名である。それにより、テンポラリファイルＴを生成するうえでの条件は、図中「＊」を付して「LIstDef」「out_file」と表記のその関数「xshun_GetReplace」の引数で定義するようにさせている。

引数LIstDefとしては、対象となるファイル、ファイルから抽出するデータの項目等を定義した連結条件ファイルをアクセスするための情報を指定する。引数out_fileとしては、テンポラリファイルＴの出力先を示す情報を指定する。本実施の形態では、それらの情報はフルパスで指定させるようにしている。引数ErrMsgは、エラーメッセージを通知するためのものである。

図１４は、連結条件ファイルに格納されたデータ例を説明する図である。それは、図８に示すジャーナルファイルＪからテンポラリファイルＴを生成させる場合のものである。
図１４に表記の「CharCode」「JnlFile」「MstFile」「ListDef」「OutputDef」及び「Jcondition」はそれぞれパラメータ名である。パラメータ「CharCode」としてはキャラクタ識別コード、パラメータ「JnlFile」としてはジャーナルファイルＪへのパス、パラメータ「MstFile」としてはマスタファイルＭへのパス、パラメータ「ListDef」としては項目ラベルと要素の対応関係、パラメータ「OutputDef」としてはテンポラリファイルＴに出力するデータの項目ラベル、パラメータ「Jcondition」としては種類が一致する項目ラベルの関係、をそれぞれ指定するようになっている。

図１４では、パラメータ「JnlFile」に対する記述により、図８に示すジャーナルファイルＪはＪｏｕｒｎａｌとして仮想的に扱うことを定義している。同様に、パラメータ「MstFile」に対する記述により、図７に示すマスタファイルＭ２はＭａｓｔｅｒ１、図６に示すマスタファイルＭ１はＭａｓｔｅｒ２として仮想的に扱うことを定義している。

パラメータ「ListDef」は、仮想的なファイル毎に、そのファイルの要素として格納されたデータの項目ラベルを定義するようになっている。その項目ラベルは「＄」を先頭に付した文字列で定義する。それにより、例えば項目ラベル「Ｋｂｎ」のデータは、ジャーナルファイルＪのタグ名「ｊｎｌ」内に配置されているタグ名「Ｎｕｍｂｅｒ」の要素として格納されたデータであることが定義されている。「ｔｅｘｔ（）」は、データの型を指定する記述である。これは他でも同様である。パラメータ「ListDef」で定義した項目ラベルのデータがテンポラリファイルＴへの出力対象として扱われる。

パラメータ「OutputDef」によるデータの指定は、パラメータ「ListDef」で記述された項目ラベルで行うようにしている。パラメータ「Jcondition」による種類が一致する項目ラベルの関係の記述も同様である。種類が同じデータも格納されたファイル別に異なる項目ラベルを定義しなければならないことから、パラメータ「Jcondition」の記述は複数のファイル間において連結して扱うべきレコートの関係（連結条件）を定義していることになる。

上記パラメータにおいて、パラメータ「CharCode」「MstFile」は省略が可能である。省略が可能なパラメータとしては、他にパラメータ「Jnode」が存在する。そのパラメータ「Jnode」としては、テンポラリファイルＴに出力するレコード単位を記述するようにしている。それにより、図９に示すジャーナルファイルＪを指定した場合には、図１５に示すように、連結条件ファイルにはパラメータ「Jnode」の記述が追加される。その記述は、ルート要素「Ｊｎｌ」のタグ名「Ｂｏｄｙ」内に配置されたタグ名「Ｍｅｉｓａｉ」の要素毎に１レコードを出力させることを表している。

関数「xshun_GetReplace」は、引数で指定された連結条件ファイルを読み込み、例えばそのファイルで指定されたマスタファイルＭから置換オートマトンＡを生成する。そのマスタファイルＭから抽出すべきデータの項目は、パラメータ「ListDef」の記述（出力項目定義）から特定する。マスタファイルＭ間で連結すべきレコードの関係はパラメータ「Jcondition」の記述（連結条件定義）から特定する。ジャーナルファイルＪから抽出すべきデータの項目も同様に、パラメータ「ListDef」「Jcondition」の各記述から特定する。そのようにして特定した項目のデータをジャーナルファイルＪから抽出して置換オートマトンＡに格納する。

マスタファイルＭ間で連結すべきレコードの関係がパラメータ「Jcondition」の記述から特定できないこともありうる。その場合には、例えばそのファイルで指定されたマスタファイルＭの一つに注目して置換オートマトンＡを生成し、残りのマスタファイルＭはジャーナルファイルＪとして扱うことで対応することができる。

置換オートマトンＡに格納したデータは、テンポラリファイルＴにパラメータ「OutputDef」として記述された項目ラベルを書き込んでから書き込まれる。それにより、図１０、或いは図１１に示すようなテンポラリファイルＴが出力されることになる。その出力先は、引数out_fileとして指定された場所である。

このようにして、本実施の形態では、端末装置１０のユーザは連結条件ファイル、及びテンポラリファイルＴの出力先を指定することで所望のテンポラリファイルＴを得られるようにしている。それにより、ジャーナルファイルＪ、或いはマスタファイルＭから抽出させるデータは連結条件ファイルにより変更できるようにさせている。そのための連結条件ファイルの更新は容易であることから、ジャーナルファイルＪ、或いはマスタファイルＭから抽出させるデータの変更も容易、且つ迅速に行うことができる。

次に、図１１に示すテンポラリファイルＴから集計結果ファイルＫを生成させる方法について具体的に説明する。
図１６は、集計結果ファイルＫを生成させるためのコマンド例を説明する図である。そのコマンドも同様にＣ言語の形式で記述するようにしている。図１６中、「shunAnalyze.h」は、集計結果ファイルＫを生成するプログラム（関数）が格納されたファイルのファイル名、「xshun_GetAnalyze」はその関数名である。集計結果ファイルＫを生成するうえでの条件は、図中「＊」を付して「CharCode」「in_file」「out_file」「Wcondition」「Gcondition」「Rcondition」「Gstring」と表記のその関数「xshun_GetAnalyze」の引数で定義するようにさせている。

ファイル「shunAnalyze.h」、及び上記ファイル「shunReplace.h」は、例えば集計装置１００、或いはサブノード２００に搭載された外部記憶装置５５（図５）に格納されている。集計装置１００に格納されている場合には、必要に応じてサブノード２００にそれらのうちの一方を送信させれば良い。それらのファイルは、記録媒体ＭＤに記録することでアクセスできるようにしても良い。

パラメータCharCodeとしては、文字コード（キャラクタ識別コード）を記述する。パラメータin_fileとしては、テンポラリファイルＴのアクセス先を示す情報を記述する。パラメータout_fileとしては、集計結果ファイルＫの出力先を示す情報を記述する。パラメータWconditionとしては、テンポラリファイルＴから統計処理の対象となるレコードを特定するための検索式を記述する。この記述は省略が可能である。

パラメータGconditionとしては、統計処理（集計）の単位となるグループ式を記述する。パラメータRconditionとしては、統計処理により得たデータ（集計結果）を出力するフォーマットを記述する。そのフォーマットでデータは正規化される。パラメータGstring」としては、集計結果として総計あるいは小計を出力する場合に、対象外となる項目ラベルのデータとして出力させる文字列を記述する。この記述は省略が可能であり、省略時には、図１２に示す「−」が出力される。

図１７は、グループ式、及び集計式の記述例を説明する図である。
グループ式中に「＄」を付して記述の「Ｋｂｎ」「Ｎｕｍｂｅｒ」は、テンポラリファイルＴに格納されているデータの項目ラベルである。そのグループ式中に記述される項目ラベルは、そのデータが同じレコードが一つのグループとして集計されることを表している。グループ式中に記述された「｝」は、総計を行うレコードのグループをその位置により表している。具体的には、「＄Ｋｂｎ」の直後に記述された「｝」は、項目ラベル「Ｋｂｎ」のデータが同じレコードを一つのグループとして集計することを表している。「＄Ｋｂｎ」の直前に記述された「｝」は、項目ラベル「Ｋｂｎ」のデータに係わらず、つまり全てのレコードを一つのグループとして集計することを表している。

図１２において、項目ラベル「Ｋｂｎ」のデータとして「０１」「０２」或いは「０３」が出力され、且つ項目ラベル「Ｎｕｍｂｅｒ」等のデータとして「−」が出力されたレコードは、「＄Ｋｂｎ」の直後に記述された「｝」により追加されたものである。項目ラベル「Ｋｂｎ」のデータとして「−」が出力されたレコードは、「＄Ｋｂｎ」の直前に記述された「｝」により追加されたものである。

グループ式には他に、「ＤＥＳＣ」「ｒｌｅｎ」及び「ｖａｌ」などが記述できるようになっている。
「ＤＥＳＣ」はラベル出力する順番を降順に指定するためのものである。「ｒｌｅｎ」は関数を示し、例えば「ｒｌｅｎ（＄Ｋｂｎ，ｎ）」といったように記述する。括弧内の「ｎ」は文字数を指定する整数である。その関数は、項目ラベルのデータとして格納された文字列から、指定された整数分の文字列を抽出するようになっている。「ｖａｌ」も関数を示し、例えば「ｖａｌ（＄Ｋｂｎ）」といったように記述する。その関数は、項目ラベルのデータとして格納された文字列から数値のみを抽出するようになっている。

集計式中に「＄」を付して記述のシンボルは、グループ式と同様に、テンポラリファイルＴに格納されているデータの項目ラベルである。括弧が途中に挿入された「ＳＵＮ（＄Ｖａｌ）ＶａｌＳＵＭ」は、括弧の前のシンボルである「ＳＵＭ」が関数を表している。その関数は、括弧内に記述された項目ラベルのデータの合計を求めるものである。括弧の後の「ＶａｌＳＵＭ」は、その合計値の項目ラベルである。括弧の前後に配置されたシンボルが表す意味は他でも同様である。関数ＭＡＸは、括弧内に記述された項目ラベルのデータのなかから最大値を抽出するものである。関数Ｃｏｕｎｔは、対象となるレコードの件数をカウントするものである。関数としては他に、データの平均値を求める関数Ａｖｅ、データの最小値を抽出する関数ＭＩＮなどが用意されている。

集計結果ファイルＫに出力する１レコードに格納すべきデータの項目は、集計式によって指定される。その集計式によって指定されるレコードは、グループ式によって指定されたグループ毎に出力される。

関数「xshun_GetAnalyze」は、記述された集計式に従って、グループ式によって指定されたグループ毎に集計を行い、その集計結果を１レコードにまとめて集計結果ファイルＫに出力する。それにより、図１７に示すグループ式、集計式を記述して図１１に示すテンポラリファイルＴからの集計結果ファイルＫの生成を端末装置１０のユーザが指示すると、そのファイルＫの内容は図１２に示すようなものとなる。

このようにして、本実施の形態では、データを出力すべき項目、その項目のデータに対して行うべき操作、及びその操作を行うべきレコードのグループを指定できるようにしている。そのため、端末装置１０のユーザは、テンポラリファイルＴから抽出させたデータ、及び操作によって得られたデータを任意に格納させた集計結果ファイルＫを取得することができる。

図１８は、テンポラリファイル生成処理のフローチャートである。その生成処理は、端末装置１０のユーザが図１３に示すようなコマンド列を集計装置１００に実行させることにより、サブノード２００で起動される。次に図１８を参照して、その生成処理について詳細に説明する。そのサブノード２００には、図１４、或いは図１５に示すような連結条件ファイル等も集計装置１００から送信される。

先ず、ステップＳ１では、連結条件ファイル中で指定された各マスタファイルＭから１レコードを読み出し、パラメータ「Jcondition」として記述された連結条件定義、及びパラメータ「ListDef」として記述された出力項目定義に従って、それらのレコードから抽出すべき項目のデータを抽出する。続くステップＳ２では、連結条件定義をキーにレコードを連結させ、各レコードから出力項目定義で指定された項目のデータを抽出して置換オートマトンＡを１レコード分、作成する。その後はステップＳ３に移行して、各マスタファイルＭから読み出すべきレコードが他に無いか否か判定する。読み出すべきレコードが存在しなかった場合、判定はＹＥＳとなってステップＳ４に移行し、そうでない場合には、判定はＮＯとなって上記ステップＳ１に戻る。それにより、別のレコードの読み出しを行う。

マスタファイルＭが複数、指定され、それらの間の連結条件が定義されていた場合、或るマスタファイルＭから読み出したレコードの内容によってそれと連結させるべきレコードは限定される。このことから、上記ステップＳ１では、例えば一つのマスタファイルＭに着目してレコードを読み出すと、他のマスタファイルＭからはそのレコードと連結させるべきレコードを読み出すようにしている。

ステップＳ４以降では、作成した置換オートマトンＡを用いてジャーナルファイルＪから必要なデータを抽出し、テンポラリファイルＴを出力するための処理が行われる。
先ず、ステップＳ４では、ジャーナルファイルＪから１レコードを読み出し、そのレコード中から、連結条件定義、出力項目定義でそれぞれ指定された要素のデータを抽出する。次のステップＳ５では、連結条件定義から抽出したデータを用いて置換オートマトンＡを参照し、出力項目定義から抽出したデータのなかでオートマトンＡに格納すべき出力項目のデータを取得する。その後はステップＳ６に移行する。

ステップＳ６では、取得した出力項目のデータを置換オートマトンＡに格納する。次のステップＳ７では、ジャーナルファイルＪに読み出す対象となる他のレコードが存在しないか否か判定する。そのようなレコードが存在しない場合、判定はＹＥＳとなり、パラメータ「OutputDef」の記述内容（出力順番定義）に従い、項目ラベル名を１レコード目に格納し、置換オートマトンＡに格納したデータを２レコード目以降のレコードに終端ノード別に格納したテンポラリファイルＴを指定された出力先（図１３）に出力した後、一連の処理を終了する。そうでない場合には、判定はＮＯとなって上記ステップＳ４に戻る。それにより、ジャーナルファイルＪから別のレコードの読み出しを行う。

図１９は、集計結果ファイル生成処理のフローチャートである。その生成処理は、端末装置１０のユーザが図１６に示すようなコマンド列を集計装置１００に実行させることにより、サブノード２００で起動される。次に図１９を参照して、その生成処理について詳細に説明する。

先ず、ステップＳ１１では、指定されたテンポラリファイルＴから１レコードを読み出し、そのレコード中から、検索式、グループ式、及び集計式を考慮して対象となる項目のデータを抽出する。続くステップＳ１２では、その抽出により取得したデータから統計ヒドラＨ（図３Ｃ）をそのデータに応じて作成する。その次に移行するステップＳ１３では、テンポラリファイルＴに読み出す対象となる他のレコードが存在しないか否か判定する。そのようなレコードが存在しない場合、判定はＹＥＳとなってステップＳ１４に移行し、そうでない場合には、判定はＮＯとなって上記ステップＳ１１に戻る。

ステップＳ１３でのＹＥＳの判定は、テンポラリファイルＴから統計ヒドラＨに格納すべきデータを全て格納したことを意味する。このことから、ステップＳ１４以降では、統計ヒドラＨを用いてデータの集計を行い、その集計結果を集計結果ファイルＫとして出力するための処理が行われる。

先ず、ステップＳ１４では、統計ヒドラＨで注目するノードを対象に、グループ式、及び集計式により指定されるデータの集計を行う。続くステップＳ１５では、統計ヒドラＨに他に注目すべきノードが存在しないか否か判定する。そのようなノードが存在しない場合、つまり行うべき集計を全て行った場合、判定はＹＥＳとなってステップＳ１６に移行し、グループ式、集計式に従い、集計結果をレコード単位で出力することで集計結果ファイルＫを生成し、生成したファイルＫを指定の出力先に出力した後、一連の処理を終了する。そうでない場合には、判定はＮＯとなってステップＳ１４に戻り、注目するノードを変えて集計を同様に行う。

なお、本実施の形態では、テンポラリファイルＴの生成はマスタファイルＭ、及びジャーナルファイルＪを対象に行うようにさせているが、その対象として別のテンポラリファイルＴ、或いは集計結果ファイルＫを指定できるようにしても良い。集計結果ファイルＫの生成では、複数のテンポラリファイルＴを対象に行えるようにしても良い。別の集計結果ファイルＫも対象として指定できるようにしても良い。

本実施の形態では、ユーザの要望により幅広く対応できるように、テンポラリファイルＴ、集計結果ファイルＫはそれぞれ別に生成するようにしているが、マスタファイルＭ、ジャーナルファイルＪから集計結果ファイルＫを生成するようにしても良い。そのようにする場合、テンポラリファイルＴの出力の有無をユーザが選択できるようにすることが望ましい。

マスタファイルＭ、ジャーナルファイルＪはＸＭＬ形式でデータが記述されたファイルであるが、それらは別の形式でデータが記述されたファイルであっても良い。ＣＳＶファイルであっても良い。どのような項目のデータがどのような形式でどのような形で格納されているかを示す情報を用意することにより、様々な種類のファイルに対応することができる。

（付記１）
一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できる装置であって、
前記必要なデータの項目を示す項目情報を取得する情報取得手段と、
前記情報取得手段が取得した項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納するデータ併合手段と、
を具備することを特徴とするデータ集計装置。

（付記２）
前記データ併合手段は、複数のファイルから必要なデータを抽出する場合、少なくとも一つのファイルに格納されている必要なデータから状態遷移テーブルを作成し、残りのファイルに格納されている必要なデータを該状態遷移テーブルにより抽出する、
ことを特徴とする付記１記載のデータ集計装置。

（付記３）
前記情報取得手段は、前記項目情報の他に、前記必要なデータを対象に行うべき操作を示す操作情報を取得することができ、
前記データ併合手段は、前記情報取得手段が操作情報を取得した場合、前記項目情報を基に前記必要なデータを一時ファイルに格納し、該一時ファイルに格納した必要なデータを対象に該操作情報が示す操作を行い、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに前記別ファイルに格納する、
ことを特徴とする付記１記載のデータ集計装置。

（付記４）
前記操作情報は、前記別ファイルに出力すべきデータの項目を示す他の項目情報を含み、
前記データ併合手段は、前記一時ファイルに格納したデータのなかで前記別ファイルに格納するデータを前記他の項目情報に従って抽出する、
ことを特徴とする付記３記載のデータ集計装置。

（付記５）
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できる装置であって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する情報取得手段と、
前記情報取得手段が取得した操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行う操作手段と、
前記操作手段が前記操作を行うことにより得られたデータを前記別ファイルに出力するデータ出力手段と、
を具備することを特徴とするデータ集計装置。

（付記６）
前記操作手段は、前記複数のファイルのうちの一つに格納されている必要なデータから状態遷移テーブルを作成し、残りのファイルに格納されている必要なデータを該状態遷移テーブルにより抽出する、
ことを特徴とする付記５記載のデータ集計装置。

（付記７）
一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納するための方法であって、
前記必要なデータの項目を示す項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納するプログラムを用意し、
前記プログラムに前記項目情報を与えて実行させることにより、前記一つ以上のファイルから必要なデータを抽出させて前記別ファイルに格納させる、
ことを特徴とするデータ集計方法。

（付記８）
前記プログラムを、前記項目情報の他に、前記必要なデータを対象に行うべき操作を示す操作情報に対応させ、
前記プログラムに前記項目情報、及び前記操作情報を与えて実行させることにより、前記一つ以上のファイルから必要なデータを抽出させるとともに、該必要なデータを対象に該操作情報が示す操作を行わせ、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに前記別ファイルに格納させる、
ことを特徴とする付記７記載のデータ集計方法。

（付記９）
前記プログラムとして、前記項目情報に対応させた第１のプログラム、及び前記操作情報に対応させた第２のプログラム、をそれぞれ用意し、
前記第２のプログラムによる前記操作情報が示す操作は、前記第１のプログラムが生成するファイルに格納されたデータを対象に行わせる、
ことを特徴とする付記８記載のデータ集計方法。

（付記１０）
前記第２のプログラムは、前記操作情報として、前記別ファイルに出力すべきデータの項目を示す他の項目情報を含む操作情報に対応させる、
ことを特徴とする付記９記載のデータ集計方法。

（付記１１）
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納するための方法であって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行うプログラムを用意し、
前記プログラムに前記操作情報を与えて実行させることにより、前記複数のファイルから操作の対象となるデータを抽出して操作を行わせ、該操作によって得られたデータを前記別ファイルに格納させる、
ことを特徴とするデータ集計方法。

（付記１２）
一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できるデータ集計装置に実行させるプログラムであって、
前記必要なデータの項目を示す項目情報を取得する機能と、
前記取得する機能により取得した項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納する機能と、
を実現させるためのプログラム。

（付記１３）
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できるデータ集計装置に実行させるプログラムであって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する機能と、
前記取得する機能により取得した操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行う機能と、
前記操作を行う機能によって前記操作を行うことにより得られたデータを前記別ファイルに出力する機能と、
を実現させるためのプログラム。

データウェアハウスを用いてアプリケーション・プログラム間のデータの受け渡しを実現させる方法を説明する図である。図１に示す実現方法によってアプリケーション・プログラム間で行われるデータの受け渡し例を説明する図である。本実施の形態によるデータ集計装置が行う処理の概要を説明する図である。図３Ａに示すマスタファイルＭに格納されたデータ例を説明する図である。図３Ａに示すマスタファイルＭ、及び集計条件ＳＣから作成される統計ヒドラＨの構成例を説明する図である。本実施の形態によるデータ集計装置の機能構成を説明する図である。本実施の形態によるデータ集計装置を実現できるコンピュータのハードウェア構成の一例を示す図である。マスタファイルのデータ構成を説明する図である（その１）。マスタファイルのデータ構成を説明する図である（その２）。ジャーナルファイルのデータ構成を説明する図である。ジャーナルファイルの他のデータ構成を説明する図である。テンポラリファイルのデータ構成を説明する図である。テンポラリファイルのデータ構成を説明する図である（レコード数がより多い場合）。集計結果ファイルのデータ構成を説明する図である。テンポラリファイルを生成させるためのコマンド例を説明する図である。連結条件ファイルに格納されたデータ例を説明する図である。連結条件ファイルに格納された別のデータ例を説明する図である。集計結果ファイルを生成させるためのコマンド例を説明する図である。グループ式、及び集計式の記述例を説明する図である。テンポラリファイル生成処理のフローチャートである。集計結果ファイル生成処理のフローチャートである。

符号の説明

１００データ集計装置
１０１データ配布部
１０２集計命令通知部
１０３集計結果併合部
１０４集計結果応答部
２００データ集計装置サブノード
２０１データ受取部
２０２集計命令受取部
２０３データ併合置換部
２０４データ集計部
２０５集計結果通知部
Ａ置換オートマトン
Ｈ統計ヒドラ
Ｊ、Ｊ１ジャーナルファイル
Ｋ、Ｋ１集計結果ファイル
Ｍ、Ｍ１マスタファイル
Ｔ、Ｔ１テンポラリファイル

Claims

一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できる装置であって、
前記必要なデータの項目を示す項目情報を取得する情報取得手段と、
前記情報取得手段が取得した項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納するデータ併合手段と、
を具備することを特徴とするデータ集計装置。
前記データ併合手段は、複数のファイルから必要なデータを抽出する場合、少なくとも一つのファイルに格納されている必要なデータから状態遷移テーブルを作成し、残りのファイルに格納されている必要なデータを該状態遷移テーブルにより抽出する、
ことを特徴とする請求項１記載のデータ集計装置。
前記情報取得手段は、前記項目情報の他に、前記必要なデータを対象に行うべき操作を示す操作情報を取得することができ、
前記データ併合手段は、前記情報取得手段が操作情報を取得した場合、前記項目情報を基に前記必要なデータを一時ファイルに格納し、該一時ファイルに格納した必要なデータを対象に該操作情報が示す操作を行い、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに前記別ファイルに格納する、
ことを特徴とする請求項１記載のデータ集計装置。
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できる装置であって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する情報取得手段と、
前記情報取得手段が取得した操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行う操作手段と、
前記操作手段が前記操作を行うことにより得られたデータを前記別ファイルに出力するデータ出力手段と、
を具備することを特徴とするデータ集計装置。
一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納するための方法であって、
前記必要なデータの項目を示す項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納するプログラムを用意し、
前記プログラムに前記項目情報を与えて実行させることにより、前記一つ以上のファイルから必要なデータを抽出させて前記別ファイルに格納させる、
ことを特徴とするデータ集計方法。
前記プログラムを、前記項目情報の他に、前記必要なデータを対象に行うべき操作を示す操作情報に対応させ、
前記プログラムに前記項目情報、及び前記操作情報を与えて実行させることにより、前記一つ以上のファイルから必要なデータを抽出させるとともに、該必要なデータを対象に該操作情報が示す操作を行わせ、該操作によって得られたデータを該必要なデータのうちの少なくとも一つとともに前記別ファイルに格納させる、
ことを特徴とする請求項５記載のデータ集計方法。
前記プログラムとして、前記項目情報に対応させた第１のプログラム、及び前記操作情報に対応させた第２のプログラム、をそれぞれ用意し、
前記第２のプログラムによる前記操作情報が示す操作は、前記第１のプログラムが生成するファイルに格納されたデータを対象に行わせる、
ことを特徴とする請求項６記載のデータ集計方法。
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納するための方法であって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行うプログラムを用意し、
前記プログラムに前記操作情報を与えて実行させることにより、前記複数のファイルから操作の対象となるデータを抽出して操作を行わせ、該操作によって得られたデータを前記別ファイルに格納させる、
ことを特徴とするデータ集計方法。
一つ以上のファイルにそれぞれ格納されているデータのなかで必要なデータを抽出して別ファイルに格納できるデータ集計装置に実行させるプログラムであって、
前記必要なデータの項目を示す項目情報を取得する機能と、
前記取得する機能により取得した項目情報を基に、前記一つ以上のファイルから必要なデータを抽出して前記別ファイルに格納する機能と、
を実現させるためのプログラム。
複数のファイルにそれぞれ格納されているデータを操作して得られるデータを別ファイルに格納できるデータ集計装置に実行させるプログラムであって、
前記データを対象に行うべき操作、及び該操作の対象となるデータを示す操作情報を取得する機能と、
前記取得する機能により取得した操作情報を基に、前記複数のファイルから操作の対象となるデータを抽出して操作を行う機能と、
前記操作を行う機能によって前記操作を行うことにより得られたデータを前記別ファイルに出力する機能と、
を実現させるためのプログラム。