WO2017115419A1

WO2017115419A1 - 出力データの生成方法、計算機システム、及びプログラム

Info

Publication number: WO2017115419A1
Application number: PCT/JP2015/086513
Authority: WO
Inventors: 和秀愛甲; 田中　徹; アリフヘルセティヨウィチャックソノ
Original assignee: 株式会社日立製作所
Priority date: 2015-12-28
Filing date: 2015-12-28
Publication date: 2017-07-06

Abstract

データペアを格納するデータストアを構成する複数の計算機における出力データの生成方法であって、計算機は、データストア管理部と、データ構造情報管理部と、データ変換部と、を含み、データ変換部が、出力用のデータブロックを生成する場合、データの参照関係を管理するデータ関連マップに基づいて、入力データを参照する分析データを特定するステップと、属性の属性値の算出方法を定義するデータ構造定義情報に基づいて、ターゲット属性及びターゲットデータを特定するステップと、ターゲットデータのデータ構造情報、及び業務データの属性間の関連性を管理するデータ構造関連情報に基づいて、アクセスキー及びサブキーを生成するステップと、アクセスキー及びサブキーを含むデータ取得要求をデータストア管理部に出力するステップと、複数のデータペアを用いて出力用のデータブロックの属性の属性値を算出するステップと、を含む。

Description

出力データの生成方法、計算機システム、及びプログラム

　本発明は、データ分散処理システムにおけるデータ変換処理に関する。

　ビックデータ分野における分析システムには、機械学習処理のようなバッチ型と、ストリーム処理のようなリアルタイム型がある。分析システムが扱う分析対象のデータは、各業務システムからＤａｔａ　Ｌａｋｅに集約される方式が知られている（例えば、特許文献１参照）。

米国特許出願公開第２０１４／０２８０３３３号明細書

　特許文献1に記載の技術では、従来のＤａｔａ　Ｌａｋｅにおいて、リアルタイム処理向けのデータを、ＲＤＢベースのＤａｔａ　Ｌａｋｅに統合することは困難だった。

　その原因の一つは、処理速度に加え、スパースなデータ構造の設計に起因して、データ量が増大することである。すなわち、全てのデータ構造に対応した形式のＤａｔａ　Ｌａｋｅの場合、関連しない属性値が「０」となるため、多数の「０」を有するデータがＤａｔａ　Ｌａｋｅに格納される。そのため、データ参照時の性能劣化及び消費する記憶容量の増大といった問題が発生する。

　他の原因の一つは、Ｄａｔａ　Ｌａｋｅ設計時に定義されたデータ構造を変更する場合には一旦システムを停止させる必要があるなど、柔軟性の低いことである。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、データストアを構成する複数の計算機における出力データの生成方法であって、前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有し、前記複数の計算機の各々は、業務処理を実行する複数の業務システム、及び分析処理を実行する複数の分析システムと接続し、前記業務処理において扱われる業務データは、少なくとも一つの属性から構成され、処理単位となるデータである第１データブロックを複数含み、前記分析処理において扱われる分析データは、少なくとも一つの属性から構成され、処理単位となるデータである第２データブロックを複数含み、前記データストアは、検索キー及び値から構成され、かつ、前記業務データのデータ構造及び前記分析データのデータ構造に依存しないデータであるデータペアを格納し、前記複数の計算機の少なくとも一つの計算機は、前記データストアに対する前記データペアの書込処理及び読出処理を管理するデータストア管理部と、前記業務データ及び前記分析データのデータ構造情報を管理するデータ構造情報管理部と、前記複数の第１データブロックに対応する前記複数のデータペアを用いて、前記分析システムに出力するデータブロックを生成するデータ変換部と、を含み、前記データ構造情報管理部は、前記複数の業務データの属性間の関連性を管理するデータ構造関連情報と、前記業務データ及び前記分析データの参照関係を管理するデータ関連マップと、前記分析データに含まれる前記属性の属性値の算出方法を定義するデータ構造定義情報と、を管理し、前記出力データの生成方法は、前記データ変換部が、少なくとも一つの前記業務データの少なくとも一つの前記第１データブロックを入力データとして出力用の第２データブロックを生成する場合、前記データ関連マップに基づいて、前記入力データに対応する前記業務データを参照する前記分析データを特定する第１のステップと、前記データ変換部が、前記データ構造定義情報に基づいて、前記特定された分析データに出力する前記出力用の第２データブロックの前記各属性の属性値の算出に必要な属性であるターゲット属性、及び前記ターゲット属性を含む前記業務データであるターゲットデータを特定する第２のステップと、前記データ変換部が、前記入力データ、前記ターゲットデータのデータ構造情報、及び前記データ構造関連情報に基づいて、前記ターゲットデータの前記少なくとも一つの第１データブロックを取得するためのアクセスキー、及び前記ターゲット属性の属性値を取得する前記第１データブロックを特定するためのサブキーを生成する第３のステップと、前記データ変換部が、前記ターゲットデータの識別情報、前記アクセスキー、及び前記サブキーを含むデータ取得要求を前記データストア管理部に出力する第４のステップと、前記データ変換部が、前記データストア管理部から受け取った前記ターゲット属性の属性値を含む前記第１データブロックに対応する前記複数のデータペアを用いて、前記出力用の第２データブロックの前記属性の属性値を算出することによって、前記出力用の第２データブロックを生成する第５のステップと、を含むことを特徴とする。

　本発明によれば、使用する記憶領域の削減、データ構造の動的な追加又は更新に柔軟に対応可能なＤａｔａ　Ｌａｋｅを提供できる。また、複数の業務システムの業務データ等を入力として、リアルタイムに所定のデータ形式の分析データを生成できる。したがって、リアルタイム分析処理等を実行する分析システムを統合したＤａｔａ　Ｌａｋｅを提供できる。上記以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１の計算機システムの構成例を示す図である。実施例１のデータ管理ノードのハードウェア構成及びソフトウェア構成を説明するブロック図である。実施例１のデータ構造情報の一例を説明する図である。実施例１のマスタデータの一例を説明する図である。実施例１のログデータの一例を説明する図である。実施例１のデータストアの一例を説明する図である。実施例１のデータ構造情報抽出ルールの一例を説明する図である。実施例１のデータ構造関連情報の一例を説明する図である。実施例１のデータ構造管理情報の一例を説明する図である。実施例１のデータ構造定義情報の一例を説明する図である。実施例１のデータ関連マップの一例を説明する図である。実施例１の主要部管理情報の一例を示す図である。実施例１のバッファの一例を説明する図である。実施例１の入力データのデータ構造情報の登録処理、及び出力データのデータ構造情報の登録処理の一例を説明するシーケンス図である。実施例１の入力データ登録画面の一例を示す図である。実施例１の出力データ登録画面の一例を示す図である。実施例１の業務システムのデータ変換処理の一例を説明するシーケンス図である。実施例１のマッピング処理の詳細を説明するフローチャートである。実施例１のアクセスリストの一例を示す図である。実施例１のデータ検索処理の詳細を説明するフローチャートである。実施例１の出力データ生成処理の詳細を説明するフローチャートである。実施例２のデータ管理ノードが実行する処理の流れを説明するシーケンス図である。実施例２のマッピング処理の詳細を説明するフローチャートである。

　以下、図面を参照しながら、実施形態を説明する。以下の説明では、情報を識別するための識別情報として「番号」及び「名称」等を用いている場合、これら以外の識別情報が使用されてもよい。また、「処理」は、「プログラム」であってもよい。

　図１は、実施例１の計算機システム１０の構成例を示す図である。

　計算機システム１０は、分散処理を実現するシステムであって、複数の業務システム１１０、複数の分析システム１２０、及び複数のデータ管理ノード１００から構成される。複数の業務システム１１０、複数の分析システム１２０及び複数のデータ管理ノード１００は、ネットワークスイッチ１３０を介して互いに接続される。なお、本発明は、装置間を接続するネットワークの種別に限定されず、また、装置間の接続形式に限定されない。

　本実施例では、複数のデータ管理ノード１００の記憶領域を用いてＤａｔａ　Ｌａｋｅが実現される。Ｄａｔａ　Ｌａｋｅを実現する複数のデータ管理ノード１００は分散クラスタ構成を取り、データが分散して配置される。ここで、Ｄａｔａ　Ｌａｋｅは、データの種別及びデータの大きさ等に依存することなく、多種多様なデータを格納するリポジトリを示す。

　複数のデータ管理ノード１００の各々は、制御プログラム群１０１及び管理テーブル群１０２を含む。制御プログラム群１０１及び管理テーブル群１０２の詳細については、図２を用いて説明する。

　業務システム１１０は、業務処理を実行するシステムである。なお、本発明は、業務システム１１０が実行する業務処理の種別に限定されない。一つの業務システム１１０は、一つの以上の計算機を含む。業務システム１１０に含まれる少なくとも一つの計算機は、データ送信部１１１を有し、また、データ構造情報１１２及びマスタデータ１１３を保持する。

　マスタデータ１１３は、業務処理に用いるデータである。一つの業務システム１１０が、複数のマスタデータ１１３を保持してもよい。マスタデータ１１３には、処理単位となるデータが複数含まれる。例えば、ＲＤＢに対応するマスタデータ１１３の場合、当該マスタデータ１１３には、レコードが複数含まれる。マスタデータ１１３の詳細は、図４を用いて説明する。

　以下の説明では、マスタデータ１１３を業務マスタデータ１１３とも記載する。また、業務マスタデータ１１３の処理単位のデータをデータブロックとも記載する。例えば、ＲＤＢに対応するマスタデータ１１３の場合、一つのレコードが一つのデータブロックに対応する。以下の説明では、「属性」は、一つのデータブロックを構成する属性の識別情報を表すものとする。また、以下の説明では、「属性値」は、「属性」の具体的な値を表すものとする。

　業務マスタデータ１１３は、例えば、複数の属性（フィールド）の列から構成されるレコードを複数含むテーブル形式のデータが考えられる。なお、本発明は業務マスタデータ１１３のデータ構造に限定されない。例えば、ＣＳＶ形式の業務マスタデータ１１３、リスト形式の業務マスタデータ１１３、及びセンサ情報のようなメッセージ形式の業務マスタデータ１１３でもよい。

　データ送信部１１１は、マスタデータ１１３、又は業務処理の結果であるログデータ１５０を送信する。なお、ログデータ１５０は、業務処理によって更新されたデータブロックを一つ以上含むデータである。ログデータ１５０の詳細は、図５を用いて説明する。

　データ構造情報１１２は、業務処理で扱われるデータのデータ構造を示す情報である。本実施例のデータ構造情報１１２は、業務マスタデータ１１３及びログデータ１５０のそれぞれのデータ構造を示す情報を含むものとする。データ構造情報１１２の詳細は、図３を用いて説明する。

　本実施例では、Ｄａｔａ　Ｌａｋｅには、業務処理が開始される前に保持する業務マスタデータ１１３が格納され、また、業務処理において発生したログデータ１５０がＤａｔａ　Ｌａｋｅに格納される。Ｄａｔａ　Ｌａｋｅでは、業務マスタデータ１１３とログデータ１５０とは別々に管理される。後述するように、データ管理ノード１００は、業務マスタデータ１１３のデータ構造情報１１２とは別に、ログデータ１５０のデータ構造情報も管理する。

　初期の業務マスタデータ１１３と、ログデータ１５０とを別々に管理する理由は、過去のデータを分析する場合、特定の時点のデータを分析する場合、最新値だけではなく履歴データを参照する場合、又は業務マスタデータ１１３の変更の影響をログデータに与えないようにする場合等、様々な分析処理に使用するためである。

　分析システム１２０は、一つ以上の業務システム１１０が管理する業務マスタデータ１１３を用いて所定の分析処理を実行する。なお、本発明は、分析システム１２０が実行する分析処理の種別に限定されない。一つの分析システム１２０は、一つ以上の計算機を含む。分析システム１２０に含まれる少なくとも一つの計算機は、データ受信部１２１を有し、また、データ構造情報１２２及びマスタデータ１２３を保持する。

　マスタデータ１２３は、分析処理に用いるデータである。一つの分析システム１２０が、複数のマスタデータ１２３を保持してもよい。マスタデータ１２３は、業務マスタデータ１１３と同様に、複数のデータブロックを含む。マスタデータ１２３のデータ構造は、業務マスタデータ１１３のデータ構造に依存しない。以下の説明では、マスタデータ１２３を分析マスタデータ１２３とも記載する。また、業務マスタデータ１１３及び分析マスタデータ１２３を特に区別しない場合、単にマスタデータとも記載する。

　データ構造情報１２２は、分析マスタデータ１２３のデータ構造を示す情報である。なお、データ構造情報１２２は、データ構造情報１１２と同様の情報である。

　データ受信部１２１は、データ管理ノード１００から所定のデータ構造の出力データ１６０を受信する。なお、出力データ１６０は、分析マスタデータ１２３のデータブロックを一つ以上含む。

　本実施例では、データ管理ノード１００が、Ｄａｔａ　Ｌａｋｅに格納される業務マスタデータ１１３及びログデータ１５０からデータブロック群を取得し、所定のデータ構造の出力データ１６０に当該データブロック群を変換し、出力先の装置又は記憶領域に当該出力データ１６０を出力する。出力先は、例えば、分析システム１２０又はデータ管理ノード１００の記憶領域等が考えられる。

　ここで、データ管理ノード１００のハードウェア構成及びソフトウェア構成について説明する。図２は、実施例１のデータ管理ノード１００のハードウェア構成及びソフトウェア構成を説明するブロック図である。

　データ管理ノード１００は、ハードウェア構成として、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）２０１、メモリ２０２、ネットワークインタフェース２０３、及び記憶装置２０４を有する。ＣＰＵ２０１、メモリ２０２、ネットワークインタフェース２０３、及び記憶装置２０４は、内部バス等によって互いに接続される。

　ＣＰＵ２０１は、データ管理ノード１００の各種制御処理を実行する演算装置であり、メモリ２０２に格納されるプログラムを実行する。以下の説明では、機能部を主語にして処理を説明する場合、ＣＰＵ２０１が当該機能部を実現するプログラムを実行していることを示す。

　メモリ２０２は、データ管理ノード１００の主記憶装置であり、ＣＰＵ２０１が実行するプログラム及び各種データを格納する。本実施例では、メモリ２０２は、制御プログラム群１０１及び管理テーブル群１０２を格納する。メモリ２０２は、ＣＰＵ２０１が処理に使用するワークエリアとしても用いられる。

　ネットワークインタフェース２０３は、ネットワークを介して他の装置と接続するインタフェースであり、データ管理ノード１００の通信時にプロトコル制御を行う。本実施例では、データ管理ノード１００は、ネットワークインタフェース２０３を介して、ネットワークスイッチ１３０と接続する。

　記憶装置２０４は、データ管理ノード１００の副記憶装置であり、大容量データを格納する。記憶装置２０４は、例えばＦＣ（Ｆｉｂｒｅ　Ｃｈａｎｎｅｌ）ディスク、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）ディスク、ＳＡＴＡディスク、ＡＴＡ（ＡＴ　Ａｔｔａｃｈｍｅｎｔ）ディスク、又はＳＡＳ（Ｓｅｒｉａｌ　Ａｔｔａｃｈｅｄ　ＳＣＳＩ）ディスク等である。

　ここで、メモリ２０２に格納される制御プログラム群１０１及び管理テーブル群１０２について説明する。

　制御プログラム群１０１は、データ構造情報管理部２１１、データ構造情報変換部２１２、データストア管理部２１３、及びデータ変換部２１４を実現するプログラムを含む。なお、説明のわかりやすさのために複数のプログラムとして図示しているが、一つのプログラムにまとめてもよい。また、機能毎に任意の数のプログラムに分割してもよい。

　全てのデータ管理ノード１００に同一のプログラムが格納されていなくてもよい。例えば、一つのデータ管理ノード１００がデータ構造情報管理部２１１を実現するプログラムを格納してもよい。データ構造情報変換部２１２及びデータ変換部２１４についても同様である。

　管理テーブル群１０２は、データ構造情報抽出ルール２２１、データ構造関連情報２２２、データ構造管理情報２２３、データ構造定義情報２２４、データ関連マップ２２５、主要部管理情報２２６、バッファ２２７、カウンタ２２８、及びデータストア２２９を含む。

　データ構造情報抽出ルール２２１は、データ構造関連情報２２２の生成に用いる情報である。データ構造情報抽出ルール２２１は、予め、データ管理ノード１００に設定される情報である。データ構造情報抽出ルール２２１の詳細については、図７を用いて説明する。データ構造関連情報２２２は、データ構造が異なるマスタデータ及びログデータ１５０（データブロック）の属性の関連性を管理する情報である。データ構造関連情報２２２の詳細は、図８を用いて説明する。

　データ構造管理情報２２３は、業務マスタデータ１１３及びログデータ１５０のデータ構造情報１１２、並びに分析マスタデータ１２３のデータ構造情報１２２を管理する情報である。データ構造管理情報２２３の詳細は、図９を用いて説明する。データ構造定義情報２２４は、分析マスタデータ１２３のデータ構造情報１２２の詳細な定義情報である。データ構造定義情報２２４の詳細は、図１０を用いて説明する。

　データ関連マップ２２５は、データの参照関係を管理する情報である。以下の説明では、参照元のデータをソースデータとも記載する。ここで、ソースデータは、参照先のデータの属性値の算出時に参照されるデータを示す。ソースデータは、業務マスタデータ１１３及びログデータ１５０だけではなく、分析マスタデータ１２３であってもよい。データ関連マップ２２５の詳細は、図１１を用いて説明する。

　バッファ２２７は、出力データ１６０の生成時に使用される記憶領域である。カウンタ２２８は、出力データ１６０の生成時に使用されるカウンタである。例えば、ＲＤＢベースの分析マスタデータ１２３を扱う分析システム１２０の下では、一部の属性値のみが設定されたレコード（データブロック）を含む出力データ１６０が送信された場合、データの一貫性が確保できない。そこで、データ管理ノード１００は、すべての属性値が設定されたレコードを含む出力データ１６０が生成されたか否かを確認するためにカウンタ２２８を用いる。バッファ２２７の詳細は、図１３を用いて説明する。

　データストア２２９は、業務システム１１０及び分析システム１２０が扱う各種データを格納する。本実施例のデータストア２２９は、複数のデータ管理ノード１００のメモリ２０２の記憶領域を用いて構成される。なお、複数のデータ管理ノード１００の記憶装置２０４の記憶領域を用いてデータストア２２９が構成されてもよい。

　本実施例では、データストア２２９には、業務マスタデータ１１３、ログデータ１５０、及び分析マスタデータ１２３を格納する。本実施例のデータストア２２９は、一つのキー及び一つの属性値を組み合わせたキーバリューペアとして各種データを格納する。なお、キーバリューペアには、キー及び属性値以外の情報が付加されてもよい。以下の説明では、キーバリューペアのキーをデータストアキーとも記載する。

　データ構造に依存しないキーバリューペアをデータストア２２９に格納することによって、マスタデータのデータ構造に依存しないＤａｔａ　Ｌａｋｅを実現できる。これによって、多数の属性値が「０」又は「Ｎｕｌｌ」であるようなデータがＤａｔａ　Ｌａｋｅに格納されないため、データ量の削減が可能となり、また、分析システム１２０の追加又は変更等に柔軟に対応可能なＤａｔａ　Ｌａｋｅを実現できる。データストア２２９の詳細は、図６を用いて説明する。

　なお、データストア２２９に格納されるデータはキーバリューペアでなくてもよい。すなわち、データ構造情報１１２等に依存しないデータ形式のデータであればよい。

　主要部管理情報２２６は、データブロックを一意に識別するための属性である主要部を管理するための情報である。データストアキーには、主要部が含まれる。主要部管理情報２２６の詳細は、図１２を用いて説明する。

　データ構造情報管理部２１１は、計算機システム１０において処理されるデータのデータ構造情報を管理する。具体的には、データ構造情報管理部２１１は、データ構造関連情報２２２、データ構造管理情報２２３、及びデータ構造定義情報２２４を管理する。また、データ構造情報管理部２１１は、業務システム１１０及び分析システム１２０から送信される各種要求を受け付ける。

　データ構造情報変換部２１２は、業務システム１１０から送信された要求に基づいて、データ構造情報抽出ルール２２１、データ構造管理情報２２３、及びデータ構造定義情報２２４を生成する。また、データ構造情報変換部２１２は、分析システム１２０から送信された要求に基づいて、データ構造管理情報２２３、データ構造定義情報２２４、及びデータ関連マップ２２５を生成する。

　データストア管理部２１３は、データストア２２９に対するデータの書込処理及び読出処理等を管理する。本実施例のデータストア管理部２１３は、業務マスタデータ１１３及びログデータ１５０等からキーバリューペアを生成し、生成されたキーバリューペアをデータストア２２９に格納する。また、本実施例のデータストア管理部２１３は、出力データ１６０の生成時に、データ変換部２１４と連携して、一つのデータブロックを構成する複数のキーバリューペアを取得する。

　例えば、ＲＤＢに対応する業務マスタデータ１１３を扱う業務システム１１０の場合、一つのレコードがデータブロックに対応するため、一つのレコードに含まれる複数の属性値の各々のキーバリューペアがデータストア２２９に格納される。データストア管理部２１３は、データ変換部２１４と連携して、一つのレコードを構成する複数のキーバリューペアを取得する。

　データ変換部２１４は、データストア２２９に格納される一つ以上のキーバリューペアを用いて出力データ１６０を生成する。

　図３から図１３を用いて、計算機システム１０に含まれる情報について説明する。

　図３は、実施例１のデータ構造情報の一例を説明する図である。ここでは、業務システム１１０が管理するデータ構造情報１１２を例に説明する。

　データ構造情報１１２は、「ｓｃｈｅｍａ」欄の内に「ｃｌａｓｓ」欄を含む。「ｃｌａｓｓ」欄は、業務システム１１０が管理する業務マスタデータ１１３に対応する情報を含む。

　「ｃｌａｓｓ」欄は、「ｉｄ」欄、及び「ｐｒｏｐｅｒｔｙ」欄を含む。「ｉｄ」欄は、業務マスタデータ１１３のキーを示す情報であり、名称及び型を示す情報を含む。「ｐｒｏｐｅｒｔｙ」欄は、属性を示す情報であり、名称及び型を示す情報を含む。

　図３に示す例では、業務システム１１０は在庫管理システムであり、業務マスタデータ１１３は在庫管理情報であることを示す。また、在庫管理情報のキーとなる属性は、Ｉｎｔｅｇｅｒ型の「ＩＤ」であることを示す。また、在庫管理情報は、属性として「コード」、「名前」、「場所」、及び「個数」を含むことを示す。図３に示すように、属性「コード」は、１０文字以内の文字列であり、ｎｕｌｌの入力が禁止され、また、重複した値が禁止されている。

　図４は、実施例１のマスタデータの一例を説明する図である。ここでは、業務マスタデータ１１３を例に説明する。

　図４に示す業務マスタデータ１１３は、テーブル形式のデータであり、データ名４０１、及び一つ以上のレコードを含む。データ名４０１は、業務マスタデータ１１３の名称である。一つのレコードは、ＩＤ４０２、コード４０３、名前４０４、場所４０５、及び個数４０６から構成され、また、各属性には属性値が設定される。一つのレコードが一つのデータブロックに対応する。

　図４に示す業務マスタデータ１１３は、複数のレコードを格納する在庫管理情報である。当該在庫管理情報には、例えば、ＩＤ４０２が「ｓｔｏｃｋ１」、コード４０３が「００１０」、名前４０４が「ペン」、場所４０５が「東京」、及び個数４０６が「５０」であるレコードが含まれる。

　図５は、実施例１のログデータ１５０の一例を説明する図である。ここでは、図４に示す業務マスタデータ１１３を管理する業務システム１１０から送信されるログデータ１５０を例に説明する。

　ログデータ１５０は、業務システム１１０が扱う各データブロック（レコード）の更新履歴を一つ以上含む。一つの更新履歴は、データ名５０１、及び属性を含む。データ名５０１は、データ名４０１と同一のものである。一つのデータブロックの更新履歴は、ＩＤ５０２、コード５０３、名前５０４、場所５０５、個数５０６、及び時刻５０７から構成され、各属性には属性値が設定される。なお、時刻５０７には、データが更新された時刻が設定される。

　図５に示すログデータ１５０は、所定の期間に更新されたデータブロック（更新履歴）を複数含む。業務システム１１０は、更新されたデータブロックを一時的に保持し、所定の周期で当該データブロックをデータストア２２９に格納する。なお、更新前の業務マスタデータ１１３のコピーをログデータ１５０としてもよい。

　業務システム１１０は、業務処理の結果を業務マスタデータ１１３に反映させるとともに、更新履歴としてログデータ１５０をデータストア２２９に送信する。

　ＲＤＢに対応した業務マスタデータ１１３を管理する業務システム１１０の場合、業務システム１１０は、一つのデータ構造情報１１２、及び一つの業務マスタデータ１１３を保持する。このような業務システム１１０の場合、データ送信部１１１は、一つ以上のレコードを含むログデータ１５０とともに、一つのデータ構造情報１１２をデータ管理ノード１００に送信してもよい。

　ＪＳＯＮ（ＪａｖａＳｃｒｉｐｔ　Ｏｂｊｅｃｔ　Ｎｏｔａｔｉｏｎ）に対応した業務システム１１０の場合、業務システム１１０は、データの更新時に業務マスタデータ１１３の複製を生成する。このような業務システム１１０の場合、データ送信部１１１は、複製された複数の業務マスタデータ１１３を含むログデータ１５０とともに、一つのデータ構造情報１１２をデータ管理ノード１００に送信してもよい。

　図６は、実施例１のデータストア２２９の一例を説明する図である。

　データストア２２９は、キー６０１及びバリュー６０２から構成されるキーバリューペアを一つ以上含む。キー６０１は、キーバリューペアを一意に識別するための識別情報、すなわちデータストアキーである。バリュー６０２は、キー６０１に対応するキーバリューペアの値である。例えば、図６に示す一番目のエントリのバリュー６０２には、在庫管理情報のＩＤ４０２が「ｓｔｏｃｋ１」であるレコードの属性「時刻」の属性値が格納される。

　図６に示すデータストア２２９には、テーブル形式の在庫管理ログ情報の一つのレコードを構成する六つの属性値に対応するキーバリューペアが格納される。

　図７は、実施例１のデータ構造情報抽出ルール２２１の一例を説明する図である。

　データ構造情報抽出ルール２２１は、一つのルールを示すエントリを複数含む。一つのエントリは、属性名７０１、属性名７０２、及び正規表現７０３から構成される。

　属性名７０１及び属性名７０２は、関連するデータ構造情報１１２の属性を示す情報である。なお、属性名７０１及び属性名７０２には、業務マスタデータ１１３の名称及び属性の名称を組み合わせた識別情報が格納されてもよいし、また、属性の名称のみが格納されてもよい。正規表現７０３は、関連する属性を特定するために用いる正規表現を示す情報である。

　本実施例のデータ構造情報抽出ルール２２１には、ユーザ定義関連ルール及びパターン化関連ルールという、二つの種類のルールを登録することができる。

　ユーザ定義関連ルールは、ユーザが明示的に関連する業務マスタデータ１１３の属性を指定することによって登録されるルールである。例えば、図７の一番目のルールは、ユーザ定義関連ルールである。

　パターン化関連ルールは、関連する属性を指定することによって登録されるルールである。パターン化関連ルールには、前述した属性とともに、当該属性の属性値を抽出するためのパターンを設定することができる。例えば、図７の一番下のルールは、「ＸＸＸＸ／ＹＹ／ＺＺ」というパターンを時刻情報として抽出するためのパターン化関連ルールである。

　図８は、実施例１のデータ構造関連情報２２２の一例を説明する図である。

　データ構造関連情報２２２は、データ構造が異なる業務マスタデータの属性の関連性を示すエントリを複数含む。一つのエントリは、属性名８０１及び属性名８０２から構成される。属性名８０１及び属性名８０２は、業務マスタデータの属性の名称である。本実施例では、属性名８０１、８０２には、マスタデータ１１３の属性の名称及びログデータ１５０の属性の名称を組み合わせた情報が格納される。

　図９は、実施例１のデータ構造管理情報２２３の一例を説明する図である。

　データ構造管理情報２２３は、データ構造情報１１２、１２２に対応するエントリを複数含む。すなわち、一つのエントリが一つのデータ構造情報に対応する。一つのエントリは、マスタデータ又はログデータ１５０の属性を示す行を複数含む。具体的には一つのエントリは、データ名９０１、属性９０２、型９０３、及び主要部９０４を含む。

　データ名９０１は、データ名４０１と同一のものである。属性９０２は、業務マスタデータ１１３等に含まれるデータブロックを構成する属性の名称である。型９０３は、属性に格納される属性値のデータ型である。主要部９０４は、キーバリューペアのキーとなる属性を示す。以下の説明では、キーバリューペアのキーとなる属性を主要部とも記載する。主要部に対応する属性の主要部９０４には、所定の記号が格納される。なお、主要部となる属性は、一つでなくてもよい。この場合、複数の属性を組み合わせてデータストアキーが生成される。

　図９の一番目のエントリは、在庫管理情報のデータ構造を示し、在庫管理情報は、属性として「ＩＤ」、「コード」、「名前」、「場所」、及び「個数」を含むことを示す。また、在庫管理情報の「ＩＤ」が主要部であることを示す。

　図１０は、実施例１のデータ構造定義情報２２４の一例を説明する図である。

　データ構造定義情報２２４は、出力データ１６０、すなわち、一つの分析マスタデータ１２３のデータ構造情報１２２に対応するエントリを複数含む。また、一つのエントリは、分析マスタデータ１２３に含まれるデータブロックを構成する属性を示す行を複数含む。具体的には、一つのエントリは、データ名１００１、出力先１００２、属性１００３、生成方法１００４、集約キー１００５、及び出力形式１００６を含む。データ名１００１は、データ名４０１と同一のものである。

　出力先１００２は、出力データ１６０の出力先を示す。属性１００３は、データブロックを構成する属性の名称である。図１０に示す例では、倉庫使用量分析情報に含まれる一つのデータブロックは、属性として、日付、拠点、使用量、ペン、ノート、及びイベントが含まれることを示す。

　生成方法１００４は、ソースデータに含まれるデータブロックの属性値を用いて、分析マスタデータ１２３のデータブロックの属性値を算出するための生成方法である。生成方法１００４には、一つ以上のソースデータに含まれるデータブロックの属性値を用いた計算式等が格納される。図１０に示す例では、属性「日付」の属性値は、倉庫管理ストリーム情報に含まれるブロックデータを構成する属性「時刻」の属性値を、そのまま用いて生成されることを示す。

　集約キー１００５は、出力データ１６０の生成時に使用される属性を示す。集約キーに対応する属性の集約キー１００５には、所定の記号が格納される。図１０に示す例では、属性「日付」が集約キーとして使用される属性であることを示す。

　なお、集約キーは、出力データ１６０の生成に必要な各ソースデータに共通する属性である。なぜならば、集約キーは、データストア２２９から取得されたソースデータのデータブロック群の絞り込みに使用するものであるからである。

　出力形式１００６は、出力データ１６０のデータ形式である。図１０に示す例では、倉庫使用量分析情報に対して出力される出力データ１６０が、ＣＳＶ形式のデータとして出力されることを示す。

　図１１は、実施例１のデータ関連マップ２２５の一例を説明する図である。

　データ関連マップ２２５は、ソースデータを参照するマスタデータを列、ソースデータを行に対応させた行列形式の情報である。

　行列の各成分には、空欄及び所定の記号の少なくともいずれかが格納される。当該記号は、ソースデータの更新に伴って更新されるマスタデータであることを示す。

　図１１に示す例では、在庫管理ログ情報が更新された場合、倉庫使用量分析情報が更新されることを示す。すなわち、倉庫使用量分析情報の出力データ１６０が生成されることを示す。

　図１２は、実施例１の主要部管理情報２２６の一例を示す図である。

　主要部管理情報２２６は、マスタデータ及びログデータ１５０毎に一つのエントリを含む。一つのエントリには、主要部の具体的な属性値を示す行を複数含む。一つのエントリは、データ名１２０１及び主要部１２０２を含む。

　データ名１２０１は、マスタデータ又はログデータ１５０の名称である。主要部１２０２は、主要部の属性値である。

　図１３は、実施例１のバッファ２２７の一例を説明する図である。

　バッファ２２７は、出力データ１６０に含まれるデータブロックに対応するエントリを複数含む。また、一つのエントリは、ＩＤ１３０１、データ名１３０２、属性１３０３、及び属性値１３０４から構成される。

　ＩＤ１３０１は、バッファ２２７内のエントリを一意に識別するための識別情報である。データ名１３０２は、出力データ１６０の対象となる分析マスタデータ１２３の名称である。属性値は、算出された属性値である。

　次に、計算機システム１０の処理について説明する。まず、データ構造情報１１２、１２２等の登録処理について説明する。

　図１４は、実施例１の入力データのデータ構造情報の登録処理、及び出力データのデータ構造情報の登録処理の一例を説明するシーケンス図である。図１５は、実施例１の入力データ登録画面１５００の一例を示す図である。図１６は、実施例１の出力データ登録画面１６００の一例を示す図である。

　ここで、入力データは、データ管理ノード１００に入力されるデータを示す。ユーザは、システムの構成に応じて、マスタデータ及びログデータ１５０を入力データとして登録できる。また、出力データは、入力データから生成される所定のデータ構造を有するデータ（出力データ１６０）を示す。

　まず、入力データの登録処理について説明する。ユーザは、入力データ登録画面１５００を用いて、入力データの登録要求をデータ管理ノード１００に入力する。ここで、入力データ登録画面１５００について説明する。

　入力データ登録画面１５００は、入力データのデータ構造情報の登録、データ構造情報間の関連等を登録するために用いられる画面である。入力データ登録画面１５００は、データ管理ノード１００に表示される。なお、入力データ登録画面１５００は、業務システム１１０に含まれる計算機に表示されてもよい。

　入力データ登録画面１５００は、登録データ一覧１５１０、データ参照欄１５２０、及び入力データ登録欄１５３０の三つの欄を含む。

　登録データ一覧１５１０は、データ構造情報が登録された入力データを表示する欄であり、リスト１５１１、表示ボタン１５１２、及び削除ボタン１５１３を含む。

　リスト１５１１は、現在、データ管理ノード１００に登録されている入力データの名称のリストである。表示ボタン１５１２は、リスト１５１１において選択された入力データを表示するための操作ボタンである。削除ボタン１５１３は、リスト１５１１において選択された入力データのデータ構造情報を削除するための操作ボタンである。

　データ参照欄１５２０は、表示ボタン１５１２が操作された場合に、データ管理ノード１００に格納される入力データを表示する欄である。

　ユーザは、登録データ一覧１５１０を参照して、データ構造情報が登録されている入力データを確認する。また、ユーザは、データ参照欄１５２０に表示された入力データの詳細を確認する。ユーザは、確認結果に応じて、削除ボタン１５１３を操作することによって、選択された入力データを削除する。例えば、業務マスタデータ１１３のデータ構造を再度設定する場合、削除ボタン１５１３が操作される。

　入力データ登録欄１５３０は、入力データのデータ構造情報、及び複数のデータ構造情報間の関連性等を登録するための欄である。入力データ登録欄１５３０は、データ登録欄１５３１、スクリプト登録欄１５３２、新規作成欄１５３３、及び抽出ルール登録欄１５３４を含む。また、入力データ登録欄１５３０は、登録ボタン１５３５を含む。

　データ登録欄１５３１、スクリプト登録欄１５３２、及び新規作成欄１５３３は、入力データのデータ構造情報を登録するために用いられる。抽出ルール登録欄１５３４は、データ構造情報抽出ルール２２１にルールを登録するために用いられる。

　例えば、登録する業務マスタデータ１１３が業務システム１１０に存在する場合、ユーザは、データ登録欄１５３１に、データ構造情報１１２の格納先情報、及び、業務マスタデータ１１３が格納先情報を入力する。また、業務システム１１０の業務マスタデータ１１３を生成するためのスクリプトが業務システム１１０に存在する場合、ユーザは、スクリプト登録欄１５３２に、当該スクリプトの格納先情報を入力する。

　なお、格納先情報は、データファイルのディレクトリパス名、データを取得するためのバッチファイルのディレクトリパス名、及び、データ管理ソフトウェアへアクセスするためのＵＲＩ等がある。

　ここで、業務マスタデータ１１３のデータ構造情報１１２を登録する場合のユーザの操作方法について説明する。

　データ登録欄１５３１を用いたデータ構造情報１１２の登録処理の場合、ユーザはデータ登録欄１５３１に値を入力し、登録ボタン１５３５を操作する。この場合、データ構造情報１１２及び業務マスタデータ１１３を含む入力データの登録要求が、データ管理ノード１００に入力される。

　スクリプト登録欄１５３２を用いたデータ構造情報１１２の登録処理の場合、ユーザは、スクリプト登録欄１５３２に値を入力し、登録ボタン１５３５を操作する。この場合、スクリプトを含む入力データの登録要求が、データ管理ノード１００に入力される。なお、業務システム１１０が当該スクリプトに基づいて、登録用のデータ構造情報１１２と、業務マスタデータ１１３とを生成し、データ構造情報と、業務マスタデータ１１３を含む入力データの登録要求をデータ管理ノード１００に入力してもよい。

　登録対象のデータ構造情報１１２が業務システム１１０に登録されていない場合、ユーザは、新規作成欄１５３３に、業務マスタデータ１１３の名称、属性、及び属性のデータの型を入力し、登録ボタン１５３５を操作する。この場合、データ構造情報１１２を含む入力データの登録要求が、データ管理ノード１００に入力される。以上が、ユーザの操作方法の一例である。

　図１５の入力データ登録欄１５３０は、ＲＤＢのようなテーブル形式のデータ構造情報１１２を登録時に用いられる情報を示す。なお、本発明はこれに限定されず、ＫＶＳ形式、又はＪＳＯＮ等の半構造データ形式、ＣＳＶ等のテキスト形式のデータ構造情報１１２も入力してもよい。この場合、データ登録欄１５３１には、各データ形式のパーサープログラム、データ構造情報１１２の定義ファイル等を入力してもよい。

　ユーザは、抽出ルール登録欄１５３４に、関連する属性の名称、及び正規表現等を入力し、登録ボタン１５３５を操作する。なお、入力データの名称及び属性の名称を組み合わせた情報が入力されてもよい。入力データの登録要求には、入力データの名称及び属性の名称等が含まれる。

　図１４の説明に戻る。

　データ管理ノード１００のデータ構造情報管理部２１１は、入力データの登録要求を受け付けた場合（ステップＳ１４０１）、データ構造情報変換部２１２に、データ構造情報の登録処理の開始を指示する（ステップＳ１４０２）。なお、入力データの登録要求に入力データが含まれる場合、データ構造情報管理部２１１は、データ構造情報変換部２１２にデータ生成処理の開始を指示する（図１７参照）。

　データ構造情報管理部２１１から出力された指示に抽出ルール登録欄１５３４の入力値が含まれる場合、データ構造情報変換部２１２は、データ構造情報抽出ルール２２１を更新する（ステップＳ１４０３）。具体的には、データ構造情報管理部２１１は、データ構造情報抽出ルール２２１にエントリを追加し、属性名７０１及び属性名７０２に値を登録する。

　データ構造情報変換部２１２は、データ構造情報抽出ルール２２１が更新された場合、データ構造関連情報２２２を更新する（ステップＳ１４０４）。具体的には、以下のような処理が実行される。

　データ構造情報抽出ルール２２１にユーザ定義関連ルールが追加された場合、データ構造情報変換部２１２は、データ構造関連情報２２２にエントリを追加する。さらに、データ構造情報変換部２１２は、追加されたエントリの属性名８０１及び属性名８０２に、データ構造情報抽出ルール２２１に新たに登録されたエントリの属性名７０１及び属性名７０２の値を登録する。

　データ構造情報抽出ルール２２１にパターン化関連ルールが追加された場合、データ構造情報変換部２１２は、データ管理ノード１００に格納される業務マスタデータ１１３のデータ構造情報１１２を解析し、属性名７０１及び属性名７０２に対応する属性を検索する。データ構造情報変換部２１２は、データ構造関連情報２２２にエントリを追加し、追加されたエントリの属性名８０１及び属性名８０２に、データの名称及び検索された属性の名称を登録する。以上が、ステップＳ１４０４の処理の説明である。

　データ構造情報変換部２１２は、データ構造管理情報２２３を更新する（ステップＳ１４０５）。具体的には、以下のような処理が実行される。

　（１）入力データの登録要求に、データ登録欄１５３１又はスクリプト登録欄１５３２の入力値が含まれる場合、データ構造情報変換部２１２は、図３に示すようなデータ構造情報１１２に基づいて、入力データの名称、入力データの属性、及び属性のデータの型等を特定する。

　データ構造情報変換部２１２は、データ構造管理情報２２３にエントリを追加し、追加されたエントリのデータ名９０１に入力データの名称を登録する。データ構造情報変換部２１２は、追加されたエントリに属性の数だけ行を生成する。さらに、データ構造情報変換部２１２は、各行の属性９０２、型９０３、及び主要部９０４に値を登録する。

　（２）入力データの登録要求に、新規作成欄１５３３の入力値が含まれる場合、データ構造情報変換部２１２は、データ構造管理情報２２３にエントリを追加し、追加されたエントリのデータ名９０１に入力データの名称を登録する。データ構造情報変換部２１２は、追加されたエントリに属性の数だけ行を生成する。さらに、データ構造情報変換部２１２は、各行の属性９０２、型９０３及び主要部９０４に値を登録する。

　以上がステップＳ１４０５の処理の説明である。

　データ構造情報変換部２１２は、データ構造情報管理部２１１に処理の完了を応答する（ステップＳ１４０６）。

　次に、出力データの登録処理について説明する。ユーザは、出力データ登録画面１６００を用いて、出力データの登録要求をデータ管理ノード１００に入力する。ここで、出力データ登録画面１６００について説明する。

　出力データ登録画面１６００は、分析マスタデータ１２３のデータ構造情報１２２の登録、業務マスタデータ１１３及び分析マスタデータ１２３との間の関連性等を登録するために用いられる画面である。出力データ登録画面１６００は、データ管理ノード１００に表示される。なお、出力データ登録画面１６００は、業務システム１１０に含まれる計算機に表示されてもよい。

　出力データ登録画面１６００は、登録データ一覧１６１０、登録データ検索欄１６２０、データ参照欄１６３０、出力データ登録欄１６４０、及びデータ構造定義欄１６５０の五つの欄を含む。

　登録データ一覧１６１０は、データ構造情報１２２が登録された出力データ１６０（分析マスタデータ１２３）を表示する欄であり、リスト１６１１、及び表示ボタン１６１２、を含む。リスト１６１１、及び表示ボタン１６１２は、リスト１５１１、及び表示ボタン１５１２と同様のものである。

　登録データ検索欄１６２０は、データ構造情報１１２の検索、及びデータ構造関連情報２２２の確認を行うための欄である。登録データ検索欄１６２０は、キー１６２１、検索ボタン１６２２、及び検索結果表示領域１６２３を含む。

　キー１６２１は、登録されたデータ構造情報の検索に用いる検索キーを入力する欄である。検索ボタン１６２２は、検索処理を開始するために操作するボタンである。検索結果表示領域１６２３は、検索結果を表示する。

　検索結果表示領域１６２３には、検索キーに対応する入力データの属性、及びその他の属性が表示される。また、検索結果表示領域１６２３には、データ構造関連情報２２２に基づいて検索された入力データが木構造で表示される。すなわち、検索キーに対応する入力データが根ノードとなり、根ノードの入力データに含まれる他の属性、又は、関連する他の属性が葉ノードとなる。

　ここで、ユーザが、倉庫使用量を分析するために、キー１６２１に「使用量」を入力した場合の表示方法について説明する。

　データ構造情報管理部２１１は、検索ボタン１６２２が操作された場合、「使用量」を属性として含む拠点管理情報を検索する。データ構造情報管理部２１１は、拠点管理情報の属性「使用量」を根ノードに決定し、他の属性を葉ノードに決定する。

　さらに、データ構造情報管理部２１１は、データ構造関連情報２２２の属性名８０１を参照して、拠点管理情報の属性に一致するエントリを検索する。一致するエントリが存在する場合、データ構造情報管理部２１１は、検索された他の業務マスタデータ１１３を拠点管理情報の属性を親ノードとする子ノードに決定する。この場合、在庫管理情報及びセンサ情報が、拠点管理情報の拠点を親ノードとすることが決定される。データ構造情報管理部２１１は、同様の処理を再帰的に実行する。

　以上の処理によって、図１６に示すような検索結果が表示される。図１６に示す例では、根ノード及び葉ノードが全て表示されているが、ユーザが選択した層（ノード）について検索及び表示を行ってもよい。

　データ参照欄１６３０は、表示ボタン１６１２が操作された場合、又は、検索結果表示領域１６２３の業務マスタデータ１１３に対応するノードが選択された場合、データ管理ノード１００に格納される入力データを表示する欄である。データ参照欄１６３０は、データ参照欄１５２０と同様のものである。

　出力データ登録欄１６４０は、新たに分析マスタデータ１２３のデータ構造情報１２２等を登録するための欄である。出力データ登録欄１６４０は、データ登録欄１５３１と同様の欄１６４１を含む。

　データ構造定義欄１６５０は、分析マスタデータ１２３のデータ構造情報１２２の定義情報を登録するための欄である。データ構造定義欄１６５０は、集約キー入力欄１６５１、構造入力欄１６５２、登録ボタン１６５３、及び削除ボタン１６５４を含む。

　集約キー入力欄１６５１は、集約キーとなる属性を入力するための欄である。

　構造入力欄１６５２は、分析マスタデータ１２３に含まれる属性、及び属性値の生成方法を入力するための欄である。登録ボタン１６５３は、集約キー入力欄１６５１、構造入力欄１６５２に設定された情報に基づいて分析マスタデータ１２３のデータ構造情報１２２を登録するための操作ボタンである。削除ボタン１６５４は、集約キー入力欄１６５１、構造入力欄１６５２の値を削除するための操作ボタンである。

　ここで、ユーザの操作方法について説明する。

　分析対象の業務マスタデータ１１３が特定されている場合、ユーザは、登録データ一覧１６１０のリスト１６１１からデータ管理ノード１００に登録される業務マスタデータ１１３を選択し、表示ボタン１６１２を操作する。ユーザは、データ参照欄１６３０に表示された業務マスタデータ１１３を確認する。

　分析対象の業務マスタデータ１１３が特定されていない場合、ユーザは、登録データ検索欄１６２０のキー１６２１に値を入力し、検索ボタン１６２２を操作する。ユーザは、データ参照欄１６３０を参照して、検索結果表示領域１６２３に表示される業務マスタデータ１１３の内容を確認する。

　前述したように、ユーザは、登録データ一覧１６１０、登録データ検索欄１６２０、及びデータ参照欄１６３０を用いて、分析システム１２０における分析対象の属性等を選択する。

　次に、ユーザは、出力データ登録欄１６４０に、分析マスタデータ１２３の名称、及び分析マスタデータ１２３の格納先情報を入力する。なお、格納先情報は、データファイルのディレクトリパス名、データを取得するためのバッチファイルのディレクトリパス名、及び、データ管理ソフトウェアへアクセスするためのＵＲＩ等がある。

　次に、ユーザは、データ構造定義欄１６５０に分析マスタデータ１２３の属性値の生成方法を入力する。さらに、ユーザは、検索キーとなる分析マスタデータ１２３の属性を指定する。ユーザは、データ構造定義欄１６５０に情報を入力した後、登録ボタン１６５３を操作する。これによって、出力データ登録欄１６４０、及びデータ構造定義欄１６５０に入力された値を含む出力データの登録要求がデータ管理ノード１００に入力される。

　なお、図１６に示すような画面を用いなくてもよい。例えば、データ構造情報管理部２１１等が、アプリケーション向けのＡＰＩをユーザに対して提供してもよい。この場合、ユーザは、アプリケーションプログラムにおいて、出力フォーマット情報を変数、データ生成定義を変数への代入式として定義すればよい。

　なお、出力データ登録画面１６００を用いて定義された分析マスタデータ１２３は、新たな業務マスタデータ１１３として登録されてもよい。これによって、業務システム１１０の業務マスタデータ１１３間の関連を管理する情報として利用することができる。

　図１４の説明に戻る。

　データ管理ノード１００のデータ構造情報管理部２１１は、出力データの登録要求を受け付けた場合（ステップＳ１４０７）、データ構造情報変換部２１２に、データ構造情報１２２の登録処理の開始を指示する（ステップＳ１４０８）。

　データ構造情報変換部２１２は、データ構造管理情報２２３を更新する（ステップＳ１４０９）。具体的には、データ構造情報変換部２１２は、データ構造管理情報２２３にエントリを追加し、追加されたエントリのデータ名９０１に分析マスタデータ１２３の名称を登録する。データ構造情報変換部２１２は、追加されたエントリに属性の数だけ行を生成する。さらに、データ構造情報変換部２１２は、各行の属性９０２、型９０３、及び主要部９０４に値を登録する。

　データ構造情報変換部２１２は、データ構造定義情報２２４を更新する（ステップＳ１４１０）。具体的には以下のような処理が実行される。

　データ構造情報変換部２１２は、データ構造定義情報２２４にエントリを追加し、データ名１００１に、出力データ登録欄１６４０に入力された分析マスタデータ１２３の名称を登録する。

　データ構造情報変換部２１２は、構造入力欄１６５２に設定された属性値の数だけ行を生成し、各行の属性１００３及び生成方法１００４に値を登録する。データ構造情報変換部２１２は、集約キー入力欄１６５１に基づいて、集約キー１００５に所定の記号を設定する。また、データ構造情報変換部２１２は、構造入力欄１６５２に基づいて出力形式１００６に値を登録する。以上がステップＳ１４１０の処理の説明である。

　データ構造情報変換部２１２は、データ関連マップ２２５を更新する（ステップＳ１４１１）。具体的には以下のような処理が実行される。

　データ構造情報変換部２１２は、データ関連マップ２２５の列に、対象の分析マスタデータ１２３の列が存在するか否かを判定する。データ関連マップ２２５の列に、対象の分析マスタデータ１２３の列が存在しない場合、データ構造情報変換部２１２は、データ関連マップ２２５に、登録対象の分析マスタデータ１２３の列を追加する。

　データ構造情報変換部２１２は、データ構造定義情報２２４に追加されたエントリの各行の生成方法１００４を参照し、関連するソースデータの名称を特定する。データ構造情報変換部２１２は、データ関連マップ２２５の行に特定されたソースデータの行が存在するか否かを判定する。

　データ関連マップ２２５の行に特定されたソースデータの行が存在する場合、データ構造情報変換部２１２は、セルに記号を設定する。データ関連マップ２２５の行に特定されたソースデータの行が存在しない場合、データ構造情報変換部２１２は、特定されたソースデータの行を追加し、また、セルに記号を設定する。以上がステップＳ１４１１の処理の説明である。

　データ構造情報変換部２１２は、データ構造情報管理部２１１に処理の完了を応答する（ステップＳ１４１２）。

　次に、データ変換処理について説明する。図１７は、実施例１の業務システム１１０のデータ変換処理の一例を説明するシーケンス図である。

　データ構造情報管理部２１１は、データ送信部１１１から入力データを含むデータ登録要求を受け付ける（ステップＳ１７０１）。データ構造情報管理部２１１は、データストア管理部２１３にデータ生成処理の開始を指示する（ステップＳ１７０２）。

　データストア管理部２１３は、データ生成処理の開始の指示を受け付けた場合、データ生成処理を実行する（ステップＳ１７０３）。ここで、入力データがログデータ１５０である場合の具体的な処理について説明する。

　データストア管理部２１３は、ログデータ１５０に含まれるデータブロックを一つ選択する。データストア管理部２１３は、データ構造管理情報２２３を参照し、データ名９０１がログデータ１５０のデータ名５０１と一致するエントリを検索する。

　データストア管理部２１３は、検索されたエントリの主要部９０４を参照して、主要部となる属性を特定する。データストア管理部２１３は、所定の規則に基づいて、キーバリューペアのデータストアキーを生成する。

　例えば、データストア管理部２１３は、「ログデータ１５０の名称．主要部の属性値．属性の名称」をデータストアキーとして生成する。図５に示すログデータ１５０の場合、「在庫管理情報．ｓｔｏｃｋ１．時刻」、「在庫管理情報．ｓｔｏｃｋ１．ＩＤ」、「在庫管理情報．ｓｔｏｃｋ１．コード」、「在庫管理情報．ｓｔｏｃｋ１．名前」、「在庫管理情報．ｓｔｏｃｋ１．場所」、「在庫管理情報．ｓｔｏｃｋ１．個数」がキーとして生成される。

　データストア管理部２１３は、キー６０１に生成されたデータストアキーを設定し、また、バリュー６０２に設定されたキーに対応する属性値を設定する。

　また、データストア管理部２１３は、主要部管理情報２２６を更新する。まず、データストア管理部２１３は、データ名１２０１を参照して、ログデータ１５０の名称に一致するエントリを検索する。

　ログデータ１５０の名称に一致するエントリが存在しない場合、データストア管理部２１３は、主要部管理情報２２６にエントリを追加し、追加されたエントリのデータ名１２０１にログデータ１５０の名称を設定する。さらに、データストア管理部２１３は、追加されたエントリの主要部１２０２に行を一つ追加し、当該行に主要部の値を設定する。

　ログデータ１５０の名称に一致するエントリが存在する場合、主要部１２０２に新たな行を生成し、生成された行に主要部の値を登録する。なお、すでに同一の値が設定された行が存在する場合、改めて行を生成する必要はない。

　データストア管理部２１３は、ログデータ１５０に含まれる全てのデータブロックに対して前述した処理を実行する。

　なお、データストア管理部２１３は、通常のキーバリューペアに対応するアクセスを受け付けた場合、データストアキーに基づいてデータを検索し、また、データストアキーに基づいた書込処理及び読出処理を実行する。以上がステップＳ１７０３の処理の説明である。

　データストア管理部２１３は、データ構造情報管理部２１１に処理の完了を応答する（ステップＳ１７０４）。

　データ構造情報管理部２１１は、データストア管理部２１３から応答を受け取った場合、データ変換部２１４に処理の開始を指示する（ステップＳ１７０５）。

　データ変換部２１４は、処理の開始指示を受け付けた場合、マッピング処理を実行し（ステップＳ１７０６）、データストア管理部２１３にデータ取得要求を発行する（ステップＳ１７０７）。マッピング処理の詳細は、図１８を用いて説明する。

　データストア管理部２１３は、データ取得要求を受け付けた場合、データ検索処理を実行し（ステップＳ１７０８）、検索されたキーバリューペアをデータ変換部２１４に応答する（ステップＳ１７０９）。データ検索処理の詳細は、図２０を用いて説明する。

　データ変換部２１４は、検索されたキーバリューペアを受け取った場合、出力データ生成処理を実行する（ステップＳ１７１０）。出力データ生成処理の詳細は、図２１を用いて説明する。

　データ変換部２１４は、データ構造情報管理部２１１に生成された出力データ１６０を応答する（ステップＳ１７１１）。データ構造情報管理部２１１は、データ構造管理情報２２３のデータ名９０１に基づいて、受け取った出力データ１６０を送信する分析システム１２０を特定し、特定された分析システム１２０に出力データ１６０を送信する。

　図１８は、実施例１のマッピング処理の詳細を説明するフローチャートである。図１９は、実施例１のアクセスリストの一例を示す図である。

　データ変換部２１４は、データ関連マップ２２５に基づいて、新たな入力データ（ソースデータ）の登録に伴って更新が必要な分析マスタデータ１２３を特定する（ステップＳ１８０１）。

　具体的には、データ変換部２１４は、データ関連マップ２２５から、データ登録要求に含まれる入力データのデータ名に一致する行を検索する。データ変換部２１４は、検索された行を参照し、所定の記号が設定されたセルを特定する。当該セルの列に対応する分析マスタデータ１２３が、更新が必要な分析マスタデータ１２３である。

　例えば、データ管理ノード１００が図５に示すログデータ１５０を受信した場合、データ変換部２１４は、図１１に示すデータ関連マップ２２５の「在庫管理ログ情報」の行を参照する。この場合、データ変換部２１４は、更新が必要な分析マスタデータ１２３として、「倉庫使用量分析情報」を特定する。

　次に、データ変換部２１４は、入力データのデータブロックのループ処理を開始する（ステップＳ１８０２）。具体的には、データ変換部２１４は、入力データに含まれるデータブロックの中から、対象のデータブロックを一つ選択する。また、データ変換部２１４は、特定された分析マスタデータ１２３のループ処理を開始する（ステップＳ１８０３）。具体的には、データ変換部２１４は、特定された分析マスタデータ１２３の中から処理対象の分析マスタデータ１２３を一つ選択する。

　次に、データ変換部２１４は、選択された分析マスタデータ１２３のデータ構造定義情報２２４に基づいて、バッファ２２７にエントリを登録する（ステップＳ１８０４）。具体的には、以下のような処理が実行される。

　まず、データ変換部２１４は、バッファ２２７に空のエントリを追加し、追加されたエントリのＩＤ１３０１に所定の識別情報を設定する。また、データ変換部２１４は、追加されたエントリのデータ名１３０２に選択された分析マスタデータ１２３の名称を設定する。

　データ変換部２１４は、分析マスタデータ１２３のデータ構造定義情報２２４の属性１００３の数だけ、追加されたエントリに属性１３０３の行を追加し、各行に属性１００３に設定された名称を設定する。前述した処理によって、属性値１３０４が空のエントリがバッファ２２７に登録される。また、データ変換部２１４は、ＩＤ１３０１の値、属性１３０３の数、及びカウンタ値「０」を組み合わせたエントリをカウンタ２２８に設定する。以上がステップＳ１８０４の処理の説明である。

　次に、データ変換部２１４は、選択された分析マスタデータ１２３のデータ構造定義情報２２４に基づいて、出力データ１６０の生成に必要な属性を含む業務マスタデータ１１３及びログデータ１５０を特定する（ステップＳ１８０５）。以下の説明では、ステップＳ１８０５において特定された業務マスタデータ１１３及びログデータ１５０をターゲットデータとも記載し、また、出力データ１６０の生成に必要な属性をターゲット属性とも記載する。具体的には、以下のような処理が実行される。

　データ変換部２１４は、選択された分析マスタデータ１２３のデータ構造定義情報２２４を参照し、属性１００３の中から対象の属性を一つ選択する。データ変換部２１４は、選択された属性の生成方法１００４を参照し、選択された属性の属性値の算出に用いるデータ及び属性を特定する。

　図１０に示す例では、属性１００３が「日付」の場合、「倉庫管理ストリーム情報」が選択された属性の算出に用いるデータとなり、また、及び「時刻」が選択された属性の算出に用いる属性となる。また、属性が「ペン」の場合、「在庫管理ログ情報」が選択された属性の算出に用いるデータとなり、また、「名前」及び「個数」が選択された属性の算出に用いる属性となる。

　データ変換部２１４は、データ構造定義情報２２４のデータ名１００１を参照し、特定された属性を含むデータに一致するエントリが存在するか否かを判定する。すなわち、特定された属性を含むデータが分析マスタデータ１２３であるか否かが判定される。

　特定された属性を含むデータが業務マスタデータ１１３又はログデータ１５０であると判定された場合、データ変換部２１４は、特定されたデータをターゲットデータに決定し、また、特定された属性をターゲット属性に決定する。

　特定されたデータが分析マスタデータ１２３であると判定された場合、データ変換部２１４は、選択された分析マスタデータ１２３のエントリの生成方法１００４、及び特定された分析マスタデータ１２３のエントリの属性１００３に基づいて、特定された分析マスタデータ１２３の属性を特定する。さらに、データ変換部２１４は、特定された属性の生成方法１００４に基づいて、属性値を取得する属性を特定する。データ変換部２１４は、属性値を取得する属性を含むデータが業務マスタデータ１１３又はログデータ１５０になるまで同様の処理を繰り返し実行する。

　データ変換部２１４は、選択された分析マスタデータ１２３の全ての属性について同様の処理を実行する。これによって、分析マスタデータ１２３のデータブロックを生成するために必要となる全てのターゲットデータ及びターゲット属性を特定することができる。

　なお、以下の説明では、集約キーに対応する属性の属性値の算出に用いるターゲットデータを集約ターゲットデータとも記載し、また、集約キーに対応する属性の属性値の算出に用いるターゲット属性を集約ターゲット属性とも記載する。以上がステップＳ１８０５の処理の説明である。

　次に、データ変換部２１４は、ターゲットデータのループ処理を開始する（ステップＳ１８０６）。具体的には、データ変換部２１４は、ステップＳ１８０４において特定されたターゲットデータの中から、対象のターゲットデータを一つ選択する。以下の説明では、選択されたターゲットデータを選択ターゲットデータとも記載する。

　次に、データ変換部２１４は、データ構造関連情報２２２及びデータ構造管理情報２２３に基づいて、入力データの属性の中から選択ターゲットデータの主要部に対応する属性を特定し、さらに、選択された入力データのデータブロックから当該属性に設定する値を取得する（ステップＳ１８０７）。具体的には、以下のような処理が実行される。

　データ変換部２１４は、選択ターゲットデータの識別情報に基づいてデータ構造管理情報２２３を参照し、選択ターゲットデータに対応するエントリを検索する。データ変換部２１４は、選択ターゲットデータに対応するエントリの主要部９０４に基づいて、選択ターゲットデータの主要部を特定する。

　データ変換部２１４は、データ構造関連情報２２２を参照して、特定された選択ターゲットデータの主要部と入力データとが対応付けられたエントリを検索する。具体的には、データ変換部２１４は、属性名８０１又は属性名８０２に選択ターゲットデータの名称及び主要部の名称が設定され、かつ、属性名８０１又は属性名８０２に入力データの名称を含むエントリを検索する。前述した処理によって、選択ターゲットデータの主要部に対応する入力データの属性を特定できる。

　データ変換部２１４は、選択された入力データのデータブロックから特定された属性の属性値を取得する。

　なお、選択ターゲットデータの主要部が複数存在する場合、全ての主要部が入力データの属性と対応付けられていない場合がある。この場合、入力データの属性と対応付けができない主要部については、属性値は取得されない。

　ここで、一例を用いてステップＳ１８０７の処理を説明する。ここでは、入力データが在庫管理ログ情報であり、選択ターゲットデータが拠点管理ログ情報であると仮定する。

　データ変換部２１４は、データ構造管理情報２２３を参照し、選択ターゲットデータの主要部が「時刻」及び「ＩＤ」であることを特定する。

　データ変換部２１４は、属性名８０１又は属性名８０２に「拠点管理ログ情報．時刻」が設定され、かつ、属性名８０１又は属性名８０２に「在庫管理ログ情報」を含むエントリを検索する。

　この場合、選択ターゲットデータの主要部に対応する入力データの属性は「時刻」となる。したがって、データ変換部２１４は、データブロックの時刻の値を選択ターゲットデータの主要部「時刻」の属性値として取得する。また、データ変換部２１４は、同様の処理を実行して、データブロックのＩＤの値を選択ターゲットデータの主要部「ＩＤ」の属性値として取得する。以上がステップＳ１８０７の処理の説明である。

　次に、データ変換部２１４は、選択ターゲットデータの属性の中から集約ターゲット属性に対応する属性を特定し、選択された入力データのデータブロックから特定された属性に設定する値を取得する（ステップＳ１８０８）。以下の説明では、集約ターゲット属性に対応する選択ターゲットデータの属性をサブ属性とも記載する。具体的には、以下のような処理が実行される。

　まず、データ変換部２１４は、選択ターゲットデータが集約ターゲットデータであるか否かを判定する。

　選択ターゲットデータが集約ターゲットデータである場合、データ変換部２１４は、集約ターゲット属性をサブ属性として特定する。

　選択ターゲットデータが集約ターゲットデータではない場合、データ変換部２１４は、データ構造関連情報２２２を参照して、選択ターゲットデータの属性の中からサブ属性を特定する。具体的には、データ変換部２１４は、属性名８０１又は属性名８０２に、集約ターゲットデータの名称及び集約ターゲット属性の名称が設定され、かつ、属性名８０１又は属性名８０２に選択ターゲットデータの名称を含むエントリを検索する。これによって、データ変換部２１４は、サブ属性を特定できる。

　データ変換部２１４は、サブ属性が特定された後、選択ターゲットデータが入力データと一致するか否かを判定する。

　選択ターゲットデータが入力データと一致する場合、データ変換部２１４は、選択された入力データのデータブロックのサブ属性に対応する属性から値を取得する。

　選択ターゲットデータが入力データと一致しない場合、データ変換部２１４は、属性名８０１又は属性名８０２に選択ターゲットデータの名称及び集約ターゲット属性の名称が設定され、かつ、属性名８０１又は属性名８０２に入力データの名称を含むエントリを検索する。これによって、データ変換部２１４は、サブ属性に対応する入力データの属性を特定できる。データ変換部２１４は、選択された入力データのデータブロックの特定された属性から値を取得する。

　後述するようにサブ属性の属性値は、複数のデータブロックの中から出力データ１６０に含まれる属性値を取得するデータブロックの特定に使用する検索キーとして用いられる。

　ここで、一例を用いてステップＳ１８０８の処理を説明する。ここでは、入力データが在庫管理ログ情報であり、集約ターゲット属性が拠点管理ログ情報の時刻であり、選択ターゲットデータがセンサ情報であると仮定する。

　この場合、データ変換部２１４は、データ構造関連情報２２２を参照し、属性名８０１又は属性名８０２に、「拠点管理ログ情報．時刻」が設定され、かつ、属性名８０１又は属性名８０２に「センサ情報」を含むエントリを検索する。したがって、「センサ情報」の「時刻」がサブ属性として特定される。

　選択ターゲットデータは入力ターゲットデータに一致しないため、データ変換部２１４は、属性名８０１又は属性名８０２に「センサ情報．時刻」が設定され、かつ、属性名８０１又は属性名８０２に「在庫管理ログ情報」を含むエントリを検索する。この結果、データ変換部２１４は、「在庫管理ログ情報」のデータブロックの「時刻」の値を取得する。以上がステップＳ１８０８の処理の説明である。

　次に、データ変換部２１４は、選択ターゲットデータからキーバリューペアを取得するための情報をアクセスリスト１９００に設定する（ステップＳ１８０９）。ここで、アクセスリスト１９００及びステップＳ１８０９の処理について説明する。

　アクセスリスト１９００は、ＩＤ１９０１、ターゲットデータ名１９０２、主要部１９０３、第１属性値１９０４、サブ属性１９０５、及び第２属性値１９０６から構成されるエントリを複数含む。

　ＩＤ１９０１は、ステップＳ１８０４においてバッファ２２７に追加されたエントリのＩＤ１３０１に設定された識別情報である。ターゲットデータ名１９０２は、選択ターゲットデータの名称である。

　主要部１９０３及び第１属性値１９０４は、選択ターゲットデータの主要部の名称及び主要部に設定される属性値である。サブ属性１９０５及び第２属性値１９０６は、選択ターゲットデータのサブ属性の名称及びサブ属性に設定される属性値である。

　なお、図１９は、ログデータ１５０として、在庫管理ログ情報が入力された場合のアクセスリスト１９００の一例を示している。

　データ変換部２１４は、ターゲットデータ毎にアクセスリストにエントリを生成し、生成されたエントリのＩＤ１９０１にバッファ２２７に追加されたエントリのＩＤ１３０１と同一の値を設定する。また、データ変換部２１４は、追加されたエントリのターゲットデータ名１９０２に選択ターゲットデータの識別情報を設定する。

　データ変換部２１４は、ステップＳ１８０７において特定された主要部の数だけ行を生成し、主要部１９０３及び第１属性値１９０４に処理結果を設定する。また、データ変換部２１４は、生成されたエントリのサブ属性１９０５及び第２属性値１９０６にステップＳ１８０８の処理結果を設定する。以上がステップＳ１８０９の処理の説明である。

　次に、データ変換部２１４は、ステップＳ１８０５において特定された全てのターゲットデータについて処理が完了したか否かを判定する（ステップＳ１８１０）。

　特定された全てのターゲットデータについて処理が完了していないと判定された場合、データ変換部２１４は、ステップＳ１８０６に戻り、新たなターゲットデータを選択し、ステップＳ１８０７からステップＳ１８１０までの処理を実行する。

　特定された全てのターゲットデータについて処理が完了していると判定された場合、データ変換部２１４は、アクセスリスト１９００を含むデータ取得要求をデータストア管理部２１３に対して発行する（ステップＳ１８１１）。

　次に、データ変換部２１４は、ステップＳ１８０１において特定された全ての分析マスタデータ１２３に対して処理が完了したか否かを判定する（ステップＳ１８１２）。

　特定された全ての分析マスタデータ１２３に対して処理が完了していないと判定された場合、データ変換部２１４は、ステップＳ１８０３に戻り、新たな分析マスタデータ１２３を選択し、ステップＳ１８０４からステップＳ１８１２までの処理を実行する。

　特定された全ての分析マスタデータ１２３に対して処理が完了したと判定された場合、データ変換部２１４は、入力データに含まれる全てのデータブロックに対して処理が完了したか否かを判定する（ステップＳ１８１３）。

　入力データに含まれる全てのデータブロックに対して処理が完了していないと判定された場合、データ変換部２１４は、ステップＳ１８０２に戻り、新たなデータブロックを選択し、ステップＳ１８０３からステップＳ１８１３までの処理を実行する。

　入力データに含まれる全てのデータブロックに対して処理が完了したと判定された場合、データ変換部２１４は、マッピング処理を終了する。

　図２０は、実施例１のデータ検索処理の詳細を説明するフローチャートである。

　データストア管理部２１３は、データ変換部２１４からデータ取得要求を受け付ける（ステップＳ２００１）。データストア管理部２１３は、データ取得要求に含まれるアクセスリスト１９００のループ処理を開始する（ステップＳ２００２）。具体的には、データストア管理部２１３は、アクセスリスト１９００のエントリを一つ選択する。

　次に、データストア管理部２１３は、選択されたエントリに対応するターゲットデータのキーバリューペアを取得するためのアクセスキーを生成する（ステップＳ２００３）。具体的には、以下のような処理が実行される。

　データストア管理部２１３は、選択されたエントリの第１属性値１９０４から値を取得する。データストア管理部２１３は、主要部管理情報２２６を参照し、データ名１２０１がターゲットデータ名１９０２に一致するエントリを検索する。

　さらに、データストア管理部２１３は、検索されたエントリの主要部１２０２を参照して、全ての主要部の属性値の組合わせを含む行を検索する。データストア管理部２１３は、検索された行の主要部の値をアクセスキーとして生成する。なお、生成されるアクセスキーは複数存在する場合がある。

　なお、データストア管理部２１３は、ターゲットデータのデータ構造情報１１２を参照して、アクセスキーを生成してもよい。この場合、データストア管理部２１３は、データ名９０１が選択されたエントリのターゲットデータ名１９０２に一致するエントリを検索することによって、ターゲットデータのデータ構造情報１１２を参照できる。以上がステップＳ２００３の処理の説明である。

　次に、データストア管理部２１３は、ターゲットデータのデータ構造情報１１２及びアクセスキーに基づいて、データストア２２９からキーバリューペア群を取得する（ステップＳ２００４）。具体的には、以下のような処理が実行される。

　データストア管理部２１３は、データ名９０１が選択されたエントリのターゲットデータ名１９０２に一致するエントリを検索することによって、ターゲットデータのデータ構造情報１１２を特定する。データストア管理部２１３は、特定されたデータ構造情報１１２を参照して、ターゲットデータに含まれる属性の数を把握する。

　データストア管理部２１３は、属性カウンタを「０」に設定し、キー６０１にアクセスキーを含むキーバリューペアを検索する。データストア管理部２１３は、キー６０１にアクセスキーを含むキーバリューペアが検索された場合、属性カウンタを「１」加算する。属性カウンタの値が属性の数と一致した場合、データストア管理部２１３は、検索されたキーバリューペア群を一つのデータブロックとして一時的に保持する。また、データストア管理部２１３は、属性カウンタを「０」に初期化して、検索処理を継続する。

　本実施例のデータストア２２９は、図６に示すように、一つのデータブロックを構成する属性の順番にしたがってキーバリューペアが格納される。そのため、データストア管理部２１３は、前述のような処理に基づいて、一つのデータブロックに対応するキーバリューペア群を取得できる。以上がステップＳ２００４の処理の説明である。

　次に、データストア管理部２１３は、複数のデータブロックに対応するキーバリューペア群が取得されたか否かを判定する（ステップＳ２００５）。

　一つのデータブロックに対応するキーバリューペア群が取得された場合、データストア管理部２１３は、ステップＳ２００７に進む。

　複数のデータブロックに対応するキーバリューペア群が取得された場合、データストア管理部２１３は、選択されたエントリのサブ属性１９０５、第２属性値１９０６、及びターゲットデータのデータ構造情報１１２に基づいて、一つのデータブロックに対応するキーバリューペア群を特定する（ステップＳ２００６）。具体的には、以下のような処理が実行される。

　データストア管理部２１３は、第２属性値１９０６を検索キーとして生成する。データストア管理部２１３は、選択されたエントリのターゲットデータ名１９０２に対応するターゲットデータのデータ構造情報１１２を参照し、サブ属性１９０５に設定された属性の位置を特定する。すなわち、データストア管理部２１３は、検索キーと比較する属性の位置を特定する。

　例えば、ターゲットデータが「拠点管理ログ情報」、かつ、サブ属性１９０５が「時刻」である場合、サブ属性「時刻」の順番は「１」であることが分かる。したがって、データストア管理部２１３は、一つのデータブロックに対応するキーバリューペア群の一番目のキーバリューペアに対して、検索キーを用いた検索を実行する。

　データストア管理部２１３は、各データブロックに対応するキーバリューペア群について、特定された位置のキーバリューペアの値を参照する。データストア管理部２１３は、特定された位置のキーバリューペアの値が選択されたエントリの第２属性値１９０６に一致するキーバリューペア群を検索する。前述した処理によって、一つのデータブロックに対応するキーバリューペア群を特定することができる。以上がステップＳ２００６の処理の説明である。

　次に、データストア管理部２１３は、一つのデータブロックに対応するキーバリューペア群を含む応答をデータ変換部２１４に出力する（ステップＳ２００７）。なお、当該応答には、選択されたエントリのＩＤ１９０１及びターゲットデータ名１９０２が含まれる。

　次に、データストア管理部２１３は、アクセスリスト１９００の全てのエントリに対して処理が完了したか否かを判定する（ステップＳ２００８）。

　アクセスリスト１９００の全てのエントリに対して処理が完了していないと判定された場合、データストア管理部２１３は、ステップＳ２００２に戻り、新たなエントリを選択し、ステップＳ２００３からステップＳ２００８までの処理を実行する。

　アクセスリスト１９００の全てのエントリに対して処理が完了したと判定された場合、データストア管理部２１３は、データ検索処理を終了する。

　図２１は、実施例１の出力データ生成処理の詳細を説明するフローチャートである。

　データ変換部２１４は、データ変換部２１４は、バッファ２２７にエントリが存在するか否かを判定する（ステップＳ２１０１）。

　バッファ２２７にエントリが存在しない場合、データ変換部２１４は、出力データ生成処理を終了する。

　バッファ２２７にエントリが存在する場合、データ変換部２１４は、データ待ち状態に移行する。データ変換部２１４は、データストア管理部２１３からキーバリューペア群を含む応答を受けた場合（ステップＳ２１０２）、バッファ２２７のエントリを特定する（ステップＳ２１０３）。具体的には、データ変換部２１４は、データストア管理部２１３から受け取った応答に含まれるＩＤに基づいてバッファ２２７のエントリを特定する。

　データ変換部２１４は、分析マスタデータ１２３の属性の属性値を算出できるか否かを判定する（ステップＳ２１０４）。具体的には、以下のような処理が実行される。

　データ変換部２１４は、応答に含まれるＩＤ１９０１に基づいて、バッファ２２７のエントリを特定する。特定されたバッファ２２７のエントリのデータ名１３０２に基づいて、バッファ２２７のデータ名１３０２に対応する分析マスタデータ１２３のデータ構造定義情報２２４を参照する。

　データ変換部２１４は、データ構造定義情報２２４の生成方法１００４、及び応答に含まれるターゲットデータ名１９０２に基づいて、算出対象となる分析マスタデータ１２３の属性を特定する。データ変換部２１４は、当該属性の生成方法１００４に基づいて、当該属性の値を算出できるか否かを判定する。

　例えば、応答に含まれるキーバリューペア群のみを用いて算出される属性の値の場合、データ変換部２１４は、分析マスタデータ１２３の属性の値を算出できると判定する。一方、複数のターゲットデータのキーバリューペア群を用いて算出される属性の値であり、かつ、少なくとも一つのターゲットデータのキーバリューペア群を受け付けていない場合、データ変換部２１４は、分析マスタデータ１２３の属性の値を算出できないと判定する。以上がステップＳ２１０４の処理の説明である。

　分析マスタデータ１２３の属性の値を算出できないと判定された場合、データ変換部２１４は、ステップＳ２１０２に戻り、データ待ちの状態に移行する。このとき、データ変換部２１４は、受け付けた応答をワークエリアに一時的に格納する。

　分析マスタデータ１２３の属性の値を算出できると判定された場合、データ変換部２１４は、応答に含まれるキーバリューペア群、データ構造管理情報２２３、及びデータ構造定義情報２２４に基づいて、分析マスタデータ１２３の属性値を算出し（ステップＳ２１０５）、算出された属性値をバッファ２２７のエントリの所定の行に登録する（ステップＳ２１０６）。具体的には、以下のような処理が実行される。

　データ変換部２１４は、データ構造定義情報２２４を参照して、ターゲット属性を特定する。データ変換部２１４は、データ構造管理情報２２３を参照して、特定されたターゲットデータのデータ構造情報１１２を特定する。

　データ変換部２１４は、特定されたターゲット属性、及びデータ構造情報１１２に基づいて、キーバリューペア群の何番目のキーバリューペアの値が必要であるかを特定する。データ変換部２１４は、特定されたキーバリューペアの値を取得し、生成方法１００４に基づいて分析マスタデータ１２３の属性値を算出する。

　データ変換部２１４は、バッファ２２７のエントリの分析マスタデータ１２３の対応する属性の行に、算出された属性値を設定する。このとき、バッファ２２７のエントリのＩＤ１３０１に対応するカウンタ２２８の値を「１」加算する。以上がステップＳ２１０５及びステップＳ２１０６の処理の説明である。

　次に、データ変換部２１４は、待ち合わせが必要な分析マスタデータ１２３であるか否かを判定する（ステップＳ２１０７）。

　例えば、データ変換部２１４は、データ構造定義情報２２４の出力形式１００６に基づいて待ち合わせが必要な分析マスタデータ１２３であるか否かを判定する。テーブル形式の分析マスタデータ１２３の場合、データ変換部２１４は、待ち合わせが必要な分析マスタデータ１２３であると判定する。また、ＣＳＶ形式の分析マスタデータ１２３の場合、データ変換部２１４は、待ち合わせが不要な分析マスタデータ１２３であると判定する。なお、データ構造定義情報２２４に待ち合わせの有無を示すカラムを含めてもよい。

　待ち合わせが必要な分析マスタデータ１２３であると判定された場合、データ変換部２１４は、出力条件を満たすか否かを判定する（ステップＳ２１０８）。ここで、出力条件は、出力データ１６０を出力先に出力するか否かを判定するための条件である。

　具体的には、データ変換部２１４は、バッファのエントリに対応するカウンタ２２８のカウンタ値が属性１３０３の数以上であるか否かを判定する。カウンタ２２８のカウンタ値が属性１３０３の数以上である場合、データ変換部２１４は、出力条件を満たすと判定する。

　出力条件を満たさないと判定された場合、データ変換部２１４は、ステップＳ２１０２に戻り、データ待ちの状態に移行する。

　出力条件を満たすと判定された場合、データ変換部２１４は、データ構造定義情報２２４及びバッファ２２７のエントリの全ての属性値を用いて出力データ１６０を生成し、当該出力データを出力先に出力する（ステップＳ２１０９）。

　具体的には、データ変換部２１４は、バッファ２２７のエントリの全ての属性値を用いて、出力形式１００６に設定されたデータ形式のデータブロック（出力データ１６０）を生成する。また、データ変換部２１４は、データ構造定義情報２２４の出力先１００２に基づいて、データ構造情報管理部２１１を介して生成された出力データ１６０を出力先に出力する。

　次に、データ変換部２１４は、バッファ２２７からステップＳ２１０３において特定されたエントリを削除する（ステップＳ２１１０）。このとき、データ変換部２１４は、バッファ２２７から削除されたエントリに対応するカウンタ２２８を初期化する。その後、データ変換部２１４は、ステップＳ２１０１に戻り、同様の処理を実行する。

　ステップＳ２１０７において、待ち合わせが不要な分析マスタデータ１２３であると判定された場合、データ変換部２１４は、データ構造定義情報２２４及びバッファ２２７のエントリに設定された属性値を用いて出力データ１６０を生成し、当該出力データを出力先に出力する（ステップＳ２１１１）。

　ステップＳ２１１１の処理は、ステップＳ２１０９の処理と同様の処理である。ただし、ステップＳ２１１１の処理では、一部の属性にのみ属性値が設定されている点がステップＳ２１０９と異なる。

　データ変換部２１４は、カウンタ２２８のカウンタ値が属性１３０３の数以上であるか否かを判定する（ステップＳ２１１２）。

　カウンタ２２８のカウンタ値が属性１３０３の数より小さいと判定された場合、データ変換部２１４は、ステップＳ２１０２に戻り、データ待ちの状態に移行する。

　カウンタ２２８のカウンタ値が属性１３０３の数以上であると判定された場合、データ変換部２１４は、バッファ２２７からステップＳ２１０３において特定されたエントリを削除する（ステップＳ２１１０）。その後、データ変換部２１４は、ステップＳ２１０１に戻り、同様の処理を実行する。このとき、データ変換部２１４は、バッファ２２７から削除されたエントリに対応するカウンタ２２８を初期化する。

　前述したように、待ち合わせが必要な分析マスタデータ１２３の場合、カウンタ値は出力条件として用いられる。一方、待ち合わせが不要な分析マスタデータ１２３の場合、カウンタ値はバッファ２２７のエントリの削除条件として用いられる。

　実施例１の計算機システム１０は、以下のような効果を有する。

　第１に、ＫＶＳ形式のデータを用いてＤａｔａ　Ｌａｋｅを実現することによって、スパースな情報が作成されないためデータ容量の削減が可能となる。また、入力データ及び出力データのデータ構造の更新に柔軟に対応できる。

　第２に、データ管理ノード１００は、データ管理ノード１００が入力データを受け付けた場合、スキーマ統合及びＳＱＬ処理を行うことなく、高速にデータストア２２９からキーバリューペア群を取得し、当該キーバリューペア群を用いて所定のデータ構造の出力データ１６０を生成できる。したがって、リアルタイム分析処理及びバッチ分析処理を統合することができる。

　実施例２では、データ管理ノード１００は、出力データの登録処理が実行された後に、マッピング処理、データ検索処理、及び出力データ生成処理を実行する。以下、実施例１との差異を中心に実施例２について説明する。

　実施例２の計算機システム１０の構成は実施例１の計算機システム１０の構成と同一であるため説明を省略する。実施例２のデータ管理ノード１００、業務システム１１０、及び分析システム１２０の構成は、実施例１と同一であるため説明を省略する。また、実施例２のデータ管理ノード１００が保持する情報及びプログラムは、実施例１のデータ管理ノード１００が保持する情報及びプログラムと同一であるため説明を省略する。

　図２２は、実施例２のデータ管理ノード１００が実行する処理の流れを説明するシーケンス図である。

　データ管理ノード１００のデータ構造情報管理部２１１は、出力データの登録要求を受け付けた場合（ステップＳ２２０１）、データ構造情報変換部２１２に、データ構造情報１２２の登録処理の開始を指示する（ステップＳ２２０２）。データ構造情報変換部２１２は、データ構造管理情報２２３、データ構造定義情報２２４、及びデータ関連マップ２２５を更新する（ステップＳ２２０３、ステップＳ２２０４、ステップＳ２２０５）。データ構造情報変換部２１２は、データ構造情報管理部２１１に処理の完了を応答する（ステップＳ２２０６）。

　なお、ステップＳ２２０１からステップＳ２２０６までの処理は、ステップＳ１４０７からステップＳ１４１２までの処理と同一である。

　実施例２では、データ構造情報管理部２１１が、データ構造情報変換部２１２から応答を受け付けた場合に、データ変換部２１４にデータストア管理部２１３にデータ生成処理の開始を指示する（ステップＳ２２０７）。なお、当該指示には、新たに定義された分析マスタデータ１２３の名称が含まれる。

　データ変換部２１４は、処理の開始指示を受け付けた場合、マッピング処理を実行し（ステップＳ２２０８）、データストア管理部２１３にデータ取得要求を発行する（ステップＳ２２０９）。実施例２のマッピング処理は、実施例１のマッピング処理と一部の処理が異なる。実施例２のマッピング処理について図２３を用いて説明する。なお、実施例２のデータ取得要求に含まれるアクセスリスト１９００は、実施例１のアクセスリスト１９００と同一である。

　データストア管理部２１３は、データ取得要求を受け付けた場合、データ検索処理を実行し（ステップＳ２２１０）、検索されたキーバリューペアをデータ変換部２１４に応答する（ステップＳ２２１１）。データ変換部２１４は、検索されたキーバリューペアを受け取った場合、出力データ生成処理を実行し（ステップＳ２２１２）、データ構造情報管理部２１１に生成された出力データ１６０を応答する（ステップＳ２２１３）。

　ステップＳ２２１０からステップＳ２２１３までの処理は、ステップＳ１７０８からステップＳ１７１１までの処理と同一である。

　図２３は、実施例２のマッピング処理の詳細を説明するフローチャートである。

　データ変換部２１４は、新たに登録された分析マスタデータ１２３の生成に用いる入力データを選択する（ステップＳ２３０１）。具体的には、以下のような処理が実行される。

　データ変換部２１４は、データ構造定義情報２２４のデータ名１００１が、指示に含まれる分析マスタデータ１２３の名称と一致するエントリを検索する。データ変換部２１４は、特定されたエントリに含まれる各行の生成方法１００４に基づいて、ターゲットデータを特定する。なお、ターゲットデータの特定方法は、ステップＳ１８０５の処理で用いられる方法と同一である。

　データ変換部２１４は、特定されたターゲットデータの中から入力データを選択する。例えば、集約キー１００５が設定された属性に関連するターゲットデータを入力データとして選択する方法が考えられる。

　データ変換部２１４は、入力データのデータブロックのループ処理を開始する（ステップＳ２３０３）。

　具体的には、データ変換部２１４は、選択された入力データの取得要求をデータストア管理部２１３に発行する。なお、当該取得要求には、入力データの名称が含まれる。

　この場合、データストア管理部２１３は、入力データの名称をアクセスキーとして、キーバリューペア群を取得し、一つのデータブロックに対応するキーバリューペア群を、逐次、データ変換部２１４に出力する。なお、キーバリューペア群を取得するタイミングは、データストア管理部２１３が予め設定してもよいし、データストア管理部２１３が自ら設定してもよい。

　データ変換部２１４は、一つのデータブロックに対応するキーバリューペア群を受け取った場合、バッファ２２７にエントリを登録する（ステップＳ２３０３）。また、データ変換部２１４は、ターゲットデータを特定する（ステップＳ２３０４）。

　ステップＳ２３０３及びステップＳ２３０４の処理は、ステップＳ１８０４及びステップＳ１８０５の処理と同一である。

　データ変換部２１４は、ターゲットデータのループ処理を開始する（ステップＳ２３０５）。データ変換部２１４は、主要部及びサブ属性の属性値を取得し（ステップＳ２３０６、ステップＳ２３０７）、選択ターゲットデータからキーバリューペアを取得するための情報をアクセスリストに設定する（ステップＳ２３０８）。また、データ変換部２１４は、全てのターゲットデータについて処理が完了したか否かを判定する（ステップＳ２３０９）。

　ステップＳ２３０５からステップＳ２３０９までの処理は、ステップＳ１８０６からステップＳ１８１０までの処理と同一である。

　全てのターゲットデータについて処理が完了していないと判定された場合、データ変換部２１４は、ステップＳ２３０５に戻り、ステップＳ２３０６からステップＳ２３０９までの処理を実行する。

　全てのターゲットデータについて処理が完了していると判定された場合、データ変換部２１４は、アクセスリスト１９００を含むデータ取得要求をデータストア管理部２１３に出力する（ステップＳ２３１０）。

　ステップＳ２３１０の処理は、ステップＳ１８１１の処理と同一の処理である。

　データ変換部２１４は、選択された入力データの全てのデータブロックについて処理が完了したか否かを判定する（ステップＳ２３１１）。例えば、データ変換部２１４は、データストア管理部２１３から該当するキーバリューペアが存在しない旨の応答を受け付けた場合、選択された入力データの全てのデータブロックについて処理が完了した判定する。

　選択された入力データの全てのデータブロックについて処理が完了していないと判定された場合、データ変換部２１４は、ステップＳ２３０２に戻り、ステップＳ２３０３からステップＳ２３１１までの処理を実行する。

　選択された入力データの全てのデータブロックについて処理が完了したと判定された場合、データ変換部２１４は、マッピング処理を終了する。

　実施例２の計算機システム１０は、実施例１の計算機システム１０と同様の効果を有する。また、実施例２では、分析マスタデータ１２３のデータ構造を定義することによって、業務マスタデータ１１３等から自動的に分析マスタデータ１２３が生成される。したがって、ユーザの操作負担を低減し、分析処理の高速化を実現し、また、柔軟なシステムを実現することができる。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるＣＰＵが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｊａｖａ等の広範囲のプログラム又はスクリプト言語で実装できる。

　さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の非一時的な記憶媒体に格納し、コンピュータが備えるＣＰＵが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

　上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

Claims

　データストアを構成する複数の計算機における出力データの生成方法であって、
　前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有し、
　前記複数の計算機の各々は、業務処理を実行する複数の業務システム、及び分析処理を実行する複数の分析システムと接続し、
　前記業務処理において扱われる業務データは、少なくとも一つの属性から構成され、処理単位となるデータである第１データブロックを複数含み、
　前記分析処理において扱われる分析データは、少なくとも一つの属性から構成され、処理単位となるデータである第２データブロックを複数含み、
　前記データストアは、検索キー及び値から構成され、かつ、前記業務データのデータ構造及び前記分析データのデータ構造に依存しないデータであるデータペアを格納し、
　前記複数の計算機の少なくとも一つの計算機は、
　前記データストアに対する前記データペアの書込処理及び読出処理を管理するデータストア管理部と、
　前記業務データ及び前記分析データのデータ構造情報を管理するデータ構造情報管理部と、
　前記複数の第１データブロックに対応する前記複数のデータペアを用いて、前記分析システムに出力するデータブロックを生成するデータ変換部と、を含み、
　前記データ構造情報管理部は、
　前記複数の業務データの属性間の関連性を管理するデータ構造関連情報と、
　前記業務データ及び前記分析データの参照関係を管理するデータ関連マップと、
　前記分析データに含まれる前記属性の属性値の算出方法を定義するデータ構造定義情報と、を管理し、
　前記出力データの生成方法は、
　前記データ変換部が、少なくとも一つの前記業務データの少なくとも一つの前記第１データブロックを入力データとして出力用の第２データブロックを生成する場合、前記データ関連マップに基づいて、前記入力データに対応する前記業務データを参照する前記分析データを特定する第１のステップと、
　前記データ変換部が、前記データ構造定義情報に基づいて、前記特定された分析データに出力する前記出力用の第２データブロックの前記各属性の属性値の算出に必要な属性であるターゲット属性、及び前記ターゲット属性を含む前記業務データであるターゲットデータを特定する第２のステップと、
　前記データ変換部が、前記入力データ、前記ターゲットデータのデータ構造情報、及び前記データ構造関連情報に基づいて、前記ターゲットデータの前記少なくとも一つの第１データブロックを取得するためのアクセスキー、及び前記ターゲット属性の属性値を取得する前記第１データブロックを特定するためのサブキーを生成する第３のステップと、
　前記データ変換部が、前記ターゲットデータの識別情報、前記アクセスキー、及び前記サブキーを含むデータ取得要求を前記データストア管理部に出力する第４のステップと、
　前記データ変換部が、前記データストア管理部から受け取った前記ターゲット属性の属性値を含む前記第１データブロックに対応する前記複数のデータペアを用いて、前記出力用の第２データブロックの前記属性の属性値を算出することによって、前記出力用の第２データブロックを生成する第５のステップと、を含むことを特徴とする出力データの生成方法。
　請求項１に記載の出力データの生成方法であって、
　前記データ取得要求は、前記ターゲットデータ毎に、前記アクセスキーを生成するための第１属性値、及び前記サブキーを生成するための第２属性値を含み、
　前記出力データの生成方法は、
　前記データストア管理部が、前記第１属性値に基づいて前記アクセスキーを生成するステップと、
　前記データストア管理部が、前記ターゲットデータのデータ構造情報及び前記アクセスキーに基づいて、前記第１データブロックを構成する前記複数のデータペアを検索するステップと、
　前記データストア管理部が、前記複数の第１データブロックに対応する前記複数のデータペアが検索された場合、前記第２属性値を前記サブキーとして生成するステップと、
　前記データストア管理部が、前記複数の第１データブロックを構成する前記複数のデータペアの中から、前記ターゲット属性の属性値を取得する一つのデータブロックを特定するステップと、
　前記データストア管理部が、前記特定されたデータブロックを前記データ変換部に出力するステップと、を含むことを特徴とする出力データの生成方法。
　請求項２に記載の出力データの生成方法であって、
　前記データ構造定義情報は、
　前記出力用の第２データブロックの属性のうち、前記サブキーとして用いる属性である集約属性を示す情報と、
　前記出力用の第２データブロックの属性の属性値を算出に用いるソースデータ及び属性値の算出方法を含む定義情報と、を含み、
　前記データ構造情報は、前記データペアの検索キーとして使用する属性である主要部を示す情報を含み、
　前記第１のステップは、
　前記データ構造定義情報に基づいて、前記集約属性の属性値を算出するための前記ターゲットデータ及び前記ターゲット属性を特定するステップと、
　前記複数のターゲットデータの中から選択ターゲットデータを選択するステップと、を含み、
　前記第３のステップは、
　前記選択ターゲットデータの前記データ構造情報に基づいて、前記主要部となる属性を特定するステップと、
　前記データ構造関連情報に基づいて、前記主要部となる属性と対応関係がある前記入力データの属性を特定するステップと、
　前記特定された入力データの属性の属性値を前記第１属性値として取得するステップと、
　前記データ構造関連情報に基づいて、前記集約属性の属性値を算出するためのターゲットデータのターゲット属性と対応関係がある前記選択ターゲットデータの属性をサブ属性として特定するステップと、
　前記サブ属性に対応する前記入力データの属性の属性値を前記第２属性値として取得するステップと、
　前記選択ターゲット毎に、前記選択ターゲットの識別情報、前記第１属性値、及び前記第２属性値を含む、前記データ取得要求を生成するステップと、を含むことを特徴とする出力データの生成方法。
　請求項２に記載の出力データの生成方法であって、
　前記データ構造定義情報は、前記出力用の第２データブロックのデータ形式を定義する情報を含み、
　前記記憶装置は、前記出力用の第２データブロックの生成に使用するバッファ、及び当該バッファに設定された属性値の数を計測するカウンタを含み、
　前記第５のステップは、
　前記出力用の第２データブロックの一つの前記属性の属性値を算出するための前記複数のデータペアを受け付けた場合、前記複数のデータペアを用いて前記出力用の第２データブロックの一つの前記属性の属性値を算出するステップと、
　前記算出された属性値を前記バッファに設定するステップと、
　前記カウンタの値を更新するステップと、
　前記カウンタの値に基づいて、前記出力用の第２データブロックを出力するための出力条件を満たすか否かを判定するステップと、
　前記出力条件を満たすと判定された場合、前記データ構造定義情報に基づいて、前記バッファに格納される属性値から所定のデータ形式の前記出力用の第２データブロックを生成するステップと、を含むことを特徴とする出力データの生成方法。
　請求項１に記載の出力データの生成方法であって、
　前記複数の計算機の少なくとも一つの計算機は、前記データ関連マップを更新するデータ構造情報変換部を含み、
　前記出力データの生成方法は、
　前記データ構造情報変換部が、前記出力用の第２データブロックを含む前記分析データの前記データ構造の定義情報の登録要求を受け付けた場合、前記データ構造定義情報を更新するステップと、
　前記データ構造情報変換部が、前記更新されたデータ構造定義情報を参照して、前記出力用の第２データブロックを含む分析データが参照するデータを特定するステップと、
　前記データ構造情報変換部が、前記特定されたデータ及び前記出力用の第２データブロックを含む分析データの参照関係を前記データ関連マップに登録するステップと、を含むことを特徴とする出力データの生成方法。
　データストアを構成する複数の計算機を含む計算機システムであって、
　前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有し、
　前記複数の計算機の各々は、業務処理を実行する複数の業務システム、及び分析処理を実行する複数の分析システムと接続し、
　前記業務処理において扱われる業務データは、少なくとも一つの属性から構成され、処理単位となるデータである第１データブロックを複数含み、
　前記分析処理において扱われる分析データは、少なくとも一つの属性から構成され、処理単位となるデータである第２データブロックを複数含み、
　前記データストアは、検索キー及び値から構成され、かつ、前記業務データのデータ構造及び前記分析データのデータ構造に依存しないデータであるデータペアを格納し、
　前記複数の計算機の少なくとも一つの計算機は、
　前記データストアに対する前記データペアの書込処理及び読出処理を管理するデータストア管理部と、
　前記業務データ及び前記分析データのデータ構造情報を管理するデータ構造情報管理部と、
　前記複数の第１データブロックに対応する前記複数のデータペアを用いて、前記分析システムに出力するデータブロックを生成するデータ変換部と、を含み、
　前記データ構造情報管理部は、
　前記複数の業務データの属性間の関連性を管理するデータ構造関連情報と、
　前記業務データ及び前記分析データの参照関係を管理するデータ関連マップと、
　前記分析データに含まれる前記属性の属性値の算出方法を定義するデータ構造定義情報と、を管理し、
　前記データ変換部は、
　少なくとも一つの前記業務データの少なくとも一つの前記第１データブロックを入力データとして出力用の第２データブロックを生成する場合、前記データ関連マップに基づいて、前記入力データに対応する前記業務データを参照する前記分析データを特定し、
　前記データ構造定義情報に基づいて、前記特定された分析データに出力する前記出力用の第２データブロックの前記各属性の属性値の算出に必要な属性であるターゲット属性、及び前記ターゲット属性を含む前記業務データであるターゲットデータを特定し、
　前記入力データ、前記ターゲットデータのデータ構造情報、及び前記データ構造関連情報に基づいて、前記ターゲットデータの前記少なくとも一つの第１データブロックを取得するためのアクセスキー、及び前記ターゲット属性の属性値を取得する前記第１データブロックを特定するためのサブキーを生成し、
　前記ターゲットデータの識別情報、前記アクセスキー、及び前記サブキーを含むデータ取得要求を前記データストア管理部に出力し、
　前記データストア管理部から受け取った前記ターゲット属性の属性値を含む前記第１データブロックに対応する前記複数のデータペアを用いて、前記出力用の第２データブロックの前記属性の属性値を算出することによって、前記出力用の第２データブロックを生成することを特徴とする計算機システム。
　請求項６に記載の計算機システムであって、
　前記データ取得要求は、前記ターゲットデータ毎に、前記アクセスキーを生成するための第１属性値、及び前記サブキーを生成するための第２属性値を含み、
　前記データストア管理部は、
　前記第１属性値に基づいて前記アクセスキーを生成し、
　前記ターゲットデータのデータ構造情報及び前記アクセスキーに基づいて、前記第１データブロックを構成する前記複数のデータペアを検索し、
　前記複数の第１データブロックに対応する前記複数のデータペアが検索された場合、前記第２属性値を前記サブキーとして生成し、
　前記複数の第１データブロックを構成する前記複数のデータペアの中から、前記ターゲット属性の属性値を取得する一つのデータブロックを特定し、
　前記特定されたデータブロックを前記データ変換部に出力することを特徴とする計算機システム。
　請求項７に記載の計算機システムであって、
　前記データ構造定義情報は、
　前記出力用の第２データブロックの属性のうち、前記サブキーとして用いる属性である集約属性を示す情報と、
　前記出力用の第２データブロックの属性の属性値を算出に用いるソースデータ及び属性値の算出方法を含む定義情報と、を含み、
　前記データ構造情報は、前記データペアの検索キーとして使用する属性である主要部を示す情報を含み、
　前記データ変換部は、
　前記データ構造定義情報に基づいて、前記集約属性の属性値を算出するための前記ターゲットデータ及び前記ターゲット属性を特定し、
　前記複数のターゲットデータの中から選択ターゲットデータを選択し、
　前記選択ターゲットデータの前記データ構造情報に基づいて、前記主要部となる属性を特定し、
　前記データ構造関連情報に基づいて、前記主要部となる属性と対応関係がある前記入力データの属性を特定し、
　前記特定された入力データの属性の属性値を前記第１属性値として取得し、
　前記データ構造関連情報に基づいて、前記集約属性の属性値を算出するためのターゲットデータのターゲット属性と対応関係がある前記選択ターゲットデータの属性をサブ属性として特定し、
　前記サブ属性に対応する前記入力データの属性の属性値を前記第２属性値として取得し、
　前記選択ターゲット毎に、前記選択ターゲットの識別情報、前記第１属性値、及び前記第２属性値を含む、前記データ取得要求を生成することを特徴とする計算機システム。
　請求項７に記載の計算機システムであって、
　前記データ構造定義情報は、前記出力用の第２データブロックのデータ形式を定義する情報を含み、
　前記記憶装置は、前記出力用の第２データブロックの生成に使用するバッファ、及び当該バッファに設定された属性値の数を計測するカウンタを含み、
　前記データ変換部は、
　前記出力用の第２データブロックの一つの前記属性の属性値を算出するための前記複数のデータペアを受け付けた場合、前記複数のデータペアを用いて前記出力用の第２データブロックの一つの前記属性の属性値を算出し、
　前記算出された属性値を前記バッファに設定し、
　前記カウンタの値を更新し、
　前記カウンタの値に基づいて、前記出力用の第２データブロックを出力するための出力条件を満たすか否かを判定し、
　前記出力条件を満たすと判定された場合、前記データ構造定義情報に基づいて、前記バッファに格納される属性値から所定のデータ形式の前記出力用の第２データブロックを生成することを特徴とする計算機システム。
　請求項６に記載の計算機システムであって、
　前記複数の計算機の少なくとも一つの計算機は、前記データ関連マップを更新するデータ構造情報変換部を含み、
　前記データ構造情報変換部は、
　前記出力用の第２データブロックを含む前記分析データの前記データ構造の定義情報の登録要求を受け付けた場合、前記データ構造定義情報を更新し、
　前記更新されたデータ構造定義情報を参照して、前記出力用の第２データブロックを含む分析データが参照するデータを特定し、
　前記特定されたデータ及び前記出力用の第２データブロックを含む分析データの参照関係を前記データ関連マップに登録することを特徴とする計算機システム。
　データストアを構成する複数の計算機の少なくとも一つの計算機に実行させるプログラムであって、
　前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有し、
　前記複数の計算機の各々は、業務処理を実行する複数の業務システム、及び分析処理を実行する複数の分析システムと接続し、
　前記業務処理において扱われる業務データは、少なくとも一つの属性から構成され、処理単位となるデータである第１データブロックを複数含み、
　前記分析処理において扱われる分析データは、少なくとも一つの属性から構成され、処理単位となるデータである第２データブロックを複数含み、
　前記データストアは、検索キー及び値から構成され、かつ、前記業務データのデータ構造及び前記分析データのデータ構造に依存しないデータであるデータペアを格納し、
　前記プログラムは、
　前記データストアに対する前記データペアの書込処理及び読出処理を管理する第１の手段と、
　前記業務データ及び前記分析データのデータ構造情報を管理する第２の手段と、
　前記複数の第１データブロックに対応する前記複数のデータペアを用いて、前記分析システムに出力するデータブロックを生成する第３の手段と、を前記複数の計算機の少なくとも一つの計算機に実行させ、
　前記第２の手段は、
　前記複数の業務データの属性間の関連性を管理するデータ構造関連情報と、
　前記業務データ及び前記分析データの参照関係を管理するデータ関連マップと、
　前記分析データに含まれる前記属性の属性値の算出方法を定義するデータ構造定義情報と、を管理する手段を含み、
　前記第３の手段は、
　少なくとも一つの前記業務データの少なくとも一つの前記第１データブロックを入力データとして出力用の第２データブロックを生成する場合、前記データ関連マップに基づいて、前記入力データに対応する前記業務データを参照する前記分析データを特定する第４の手段と、
　前記データ構造定義情報に基づいて、前記特定された分析データに出力する前記出力用の第２データブロックの前記各属性の属性値の算出に必要な属性であるターゲット属性、及び前記ターゲット属性を含む前記業務データであるターゲットデータを特定する第５の手段と、
　前記入力データ、前記ターゲットデータのデータ構造情報、及び前記データ構造関連情報に基づいて、前記ターゲットデータの前記少なくとも一つの第１データブロックを取得するためのアクセスキー、及び前記ターゲット属性の属性値を取得する前記第１データブロックを特定するためのサブキーを生成する第６の手段と、
　前記ターゲットデータの識別情報、前記アクセスキー、及び前記サブキーを含むデータ取得要求を前記第１の手段に出力する第７の手段と、
　前記第１の手段から受け取った前記ターゲット属性の属性値を含む前記第１データブロックに対応する前記複数のデータペアを用いて、前記出力用の第２データブロックの前記属性の属性値を算出することによって、前記出力用の第２データブロックを生成する第８の手段と、を含むことを特徴とするプログラム。
　請求項１１に記載のプログラムであって、
　前記データ取得要求は、前記ターゲットデータ毎に、前記アクセスキーを生成するための第１属性値、及び前記サブキーを生成するための第２属性値を含み、
　前記第３の手段は、
　前記第１属性値に基づいて前記アクセスキーを生成する手段と、
　前記ターゲットデータのデータ構造情報及び前記アクセスキーに基づいて、前記第１データブロックを構成する前記複数のデータペアを検索する手段と、
　前記複数の第１データブロックに対応する前記複数のデータペアが検索された場合、前記第２属性値を前記サブキーとして生成する手段と、
　前記複数の第１データブロックを構成する前記複数のデータペアの中から、前記ターゲット属性の属性値を取得する一つのデータブロックを特定する手段と、
　前記特定されたデータブロックを前記第３の手段に出力する手段と、含むことを特徴とするプログラム。
　請求項１２に記載のプログラムであって、
　前記データ構造定義情報は、
　前記出力用の第２データブロックの属性のうち、前記サブキーとして用いる属性である集約属性を示す情報と、
　前記出力用の第２データブロックの属性の属性値を算出に用いるソースデータ及び属性値の算出方法を含む定義情報と、を含み、
　前記データ構造情報は、前記データペアの検索キーとして使用する属性である主要部を示す情報を含み、
　前記第４の手段は、
　前記データ構造定義情報に基づいて、前記集約属性の属性値を算出するための前記ターゲットデータ及び前記ターゲット属性を特定する手段と、
　前記複数のターゲットデータの中から選択ターゲットデータを選択するステップと、を含み、
　前記第６の手段は、
　前記選択ターゲットデータの前記データ構造情報に基づいて、前記主要部となる属性を特定する手段と、
　前記データ構造関連情報に基づいて、前記主要部となる属性と対応関係がある前記入力データの属性を特定する手段と、
　前記特定された入力データの属性の属性値を前記第１属性値として取得する手段と、
　前記データ構造関連情報に基づいて、前記集約属性の属性値を算出するためのターゲットデータのターゲット属性と対応関係がある前記選択ターゲットデータの属性をサブ属性として特定する手段と、
　前記サブ属性に対応する前記入力データの属性の属性値を前記第２属性値として取得する手段と、
　前記選択ターゲット毎に、前記選択ターゲットの識別情報、前記第１属性値、及び前記第２属性値を含む、前記データ取得要求を生成する手段と、を含むことを特徴とするプログラム。
　請求項１２に記載のプログラムであって、
　前記データ構造定義情報は、前記出力用の第２データブロックのデータ形式を定義する情報を含み、
　前記記憶装置は、前記出力用の第２データブロックの生成に使用するバッファ、及び当該バッファに設定された属性値の数を計測するカウンタを含み、
　前記第８の手段は、
　前記出力用の第２データブロックの一つの前記属性の属性値を算出するための前記複数のデータペアを受け付けた場合、前記複数のデータペアを用いて前記出力用の第２データブロックの一つの前記属性の属性値を算出する手段と、
　前記算出された属性値を前記バッファに設定する手段と、
　前記カウンタの値を更新する手段と、
　前記カウンタの値に基づいて、前記出力用の第２データブロックを出力するための出力条件を満たすか否かを判定する手段と、
　前記出力条件を満たすと判定された場合、前記データ構造定義情報に基づいて、前記バッファに格納される属性値から所定のデータ形式の前記出力用の第２データブロックを生成する手段と、を含むことを特徴とするプログラム。
　請求項１１に記載のプログラムであって、
　前記複数の計算機の少なくとも一つの計算機は、前記データ関連マップを更新する第９の手段を含み、
　前記第９の手段は、
　前記出力用の第２データブロックを含む前記分析データの前記データ構造の定義情報の登録要求を受け付けた場合、前記データ構造定義情報を更新する手段と、
　前記更新されたデータ構造定義情報を参照して、前記出力用の第２データブロックを含む分析データが参照するデータを特定する手段と、
　前記特定されたデータ及び前記出力用の第２データブロックを含む分析データの参照関係を前記データ関連マップに登録する手段と、を含むことを特徴とするプログラム。