JP7259973B2 - データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム - Google Patents

データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム Download PDF

Info

Publication number
JP7259973B2
JP7259973B2 JP2021543822A JP2021543822A JP7259973B2 JP 7259973 B2 JP7259973 B2 JP 7259973B2 JP 2021543822 A JP2021543822 A JP 2021543822A JP 2021543822 A JP2021543822 A JP 2021543822A JP 7259973 B2 JP7259973 B2 JP 7259973B2
Authority
JP
Japan
Prior art keywords
data
olap
event
operator
operators
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021543822A
Other languages
English (en)
Other versions
JPWO2021044497A1 (ja
Inventor
哲 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021044497A1 publication Critical patent/JPWO2021044497A1/ja
Application granted granted Critical
Publication of JP7259973B2 publication Critical patent/JP7259973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明の一態様は、データ分析処理装置、データ分析処理方法及びデータ分析処理プログラムに関する。
生成消滅及び/または状態遷移により時間的及び/または空間的に変化する実世界の事象について、その実世界の事象を体現するデータを多次元キューブに写像してオンライン分析処理(Online Analytical Processing; OLAP)操作により分析するデータ分析処理装置が知られている。
データ分析処理装置は、例えば、非特許文献1に開示されているような手法を用いる。すなわち、
(1)データを、データの種別、特性、用途に応じて区別することなく、モノリシックな多次元データベースに蓄積し、管理する。
(2)時間次元のデータとして、事象共通の時間系を基準とする事象の存在期間を保有する。
(3)空間次元のデータとして、事象共通の座標系を基準とする事象の位置と形状を保有する。
(4)非演算子としての時点あるいは期間と、演算子と、を引数として、事象共通の時間系を基準とし、多次元キューブからそれら非演算子及び演算子に該当する時間次元のデータを選択する。
(5)非演算子としての位置と形状と、演算子と、を引数として、事象共通の座標系を基準とし、多次元キューブからそれら非演算子及び演算子に該当する空間次元のデータを選択する。
また、非特許文献2に開示された手法では、さらに、(6)多次元キューブから非演算子と演算子に該当するデータを選択する場合に、複数の多次元キューブから同一の非演算子と演算子に該当するデータを選択して、選択したデータをマージすることも提案している。
S. Rivest, Y. Bedard, and P. Marchand: Toward better support for spatial decision making: Dening the characteristics of spatial on-line analytical processing (SOLAP), Geomatica, Vol.55, No.4, pp.539-555, 2001. R. Kimball(著)、藤本、岡田、下平、伊藤、小畑(訳): データウェアハウス・ツールキット, 5章, 16章, 日経BP社(1998)
従来のデータ分析処理装置は、データを分析できる範囲が十分ではなかった。
例えば、従来のデータ分析処理装置は、実世界の事象を体現するデータを蓄積及び管理しているが、そのデータの情報源である事象との関係や生成消滅及び/または状態遷移による時間的及び空間的変化を体現する時間次元及び空間次元のデータについては蓄積及び管理していない。従って、データの情報源である事象やその事象の状態遷移に着目してデータを分析することができない。
この発明は、上記事情に着目してなされたもので、その目的とするところは、データの情報源である事象やその事象の状態遷移に着目してデータの分析をできるようにするデータ分析処理装置、データ分析処理方法、データ分析処理プログラムを提供することにある。
上記課題を解決するために、この発明の第1の態様は、データ分析処理装置が、生成消滅及び状態遷移の少なくとも一方により時間的及び空間的の少なくとも一方に変化する実世界の事象について、前記事象を体現するデータを多次元キューブに写像してOLAP操作により分析するデータ分析処理装置であって、前記事象を体現するデータとしての、前記生成消滅及び状態遷移の少なくとも一方による時間的、空間的変化を体現する時間次元、空間次元及び主題に依存する複数種別の固有次元のデータと、前記時間次元、空間次元及び固有次元の前記データにより識別される前記主題に依存する前記複数種別の特性を表すデータとを、それらデータの情報源である前記事象を識別するための事象の識別子と対応付けて、前記主題ごとに構築した多次元キューブに蓄積及び管理する多次元データベース管理部と、前記多次元キューブに対して前記OLAP操作を実行するOLAP操作実行部と、を備えるようにしたものである。
この発明の第2の態様は、生成消滅及び状態遷移の少なくとも一方により時間的及び空間的の少なくとも一方に変化する実世界の事象について、前記事象を体現するデータを多次元キューブに写像してOLAP操作により分析するデータ分析処理装置が実行するデータ分析処理方法であって、前記データ分析処理装置が実行することによって、前記データ分析処理装置が、前記事象を体現するデータとしての、前記生成消滅及び状態遷移の少なくとも一方による時間的、空間的変化を体現する時間次元、空間次元及び主題に依存する複数種別の固有次元のデータと、前記時間次元、空間次元及び固有次元の前記データにより識別される前記主題に依存する前記複数種別の特性を表すデータとを、それらデータの情報源である前記事象を識別するための事象の識別子と対応付けて、記憶装置に前記主題ごとに構築した多次元キューブに蓄積及び管理し、前記データ分析処理装置が、前記多次元キューブに対して前記OLAP操作を実行する、データ分析処理方法としたものである。
この発明の第3の態様は、コンピュータのプロセッサを、この発明の第1の態様のデータ分析処理装置として機能させるようにしたものである。
この発明の各態様によれば、生成消滅及び状態遷移の少なくとも一方による時間的、空間的変化を体現する時間次元、空間次元のデータを蓄積及び管理するとともに、時間次元、空間次元のデータを含む事象を体現するデータを、それらデータの情報源である事象を識別するための事象の識別子と対応付けて蓄積及び管理することで、データの情報源である事象やその事象の状態遷移に着目してデータの分析ができるようになるデータ分析処理装置、データ分析処理方法及びデータ分析処理プログラムを提供することができる。
図1は、本発明の第1実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。 図2は、時間次元の情報を説明するための模式図である。 図3は、空間次元の情報を説明するための模式図である。 図4は、第1実施形態に係るデータ分析処理装置をコンピュータによって実現する場合の構成の一例を示すブロック図である。 図5は、第1実施形態に係るデータ分析処理装置の動作の一例を説明するためのシーケンス図である。 図6は、図1中の多次元データベース管理部が、複数の異種データベースをモノリシックな多次元データベースとして機能させる動作の一例を説明するためのフローチャートである。 図7は、図1中のOLAP操作実行部が、多次元キューブに対してOLAP操作を実行する場合の動作の一例を説明するためのフローチャートである。 図8は、図7中の時間次元データ選択処理の詳細の一例を説明するためのフローチャートである。 図9は、図7中の空間次元データ選択処理の詳細の一例を説明するためのフローチャートである。 図10は、図7中の識別子データ選択処理の詳細の一例を説明するためのフローチャートである。 図11は、図7中のデータ分類処理の詳細の一例を説明するためのフローチャートである。 図12は、本発明の第2実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。 図13Aは、第2実施形態に係るデータ分析処理装置において引継データを引数に使用しない場合の動作の一例を説明するためのシーケンス図である。 図13Bは、第2実施形態に係るデータ分析処理装置において引継データを引数に使用する場合の動作の一例を説明するためのシーケンス図である。 図14は、図13中のOLAP操作実行部による、引継データの使用に係わる動作の一例を説明するためのフローチャートである。 図15は、本発明の第3実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。 図16Aは、第3実施形態に係るデータ分析処理装置において履歴データを利用したOLAP操作の再実行を行わない場合の動作の一例を説明するためのシーケンス図である。 図16Bは、第3実施形態に係るデータ分析処理装置において履歴データを利用したOLAP操作の再実行を行う場合の動作の一例を説明するためのシーケンス図である。 図17は、図15中のOLAP操作実行部による、履歴データの利用に係わる動作の一例を説明するためのフローチャートである。
以下、図面を参照してこの発明に係わる実施形態を説明する。
[第1実施形態]
(構成)
図1は、この発明の第1実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。
データ分析処理装置10は、OLAP操作実行部11と、多次元データベース管理部12と、データカタログ13と、複数の要素データベースと、を有する。要素データベースは、第1要素データベース141と、複数の第2要素データベース142と、複数の第3要素データベース143と、を有する。なお、以下の説明において、第1乃至第3要素データベースを区別しない場合には、単に要素データベース14と記す。
第1要素データベース141は、生成消滅及び/または状態遷移により時間的及び/または空間的に変化する実世界の事象について、その事象を体現するデータとしての、生成消滅及び/または状態遷移による時間的変化と空間的変化とを体現する時間次元のデータと空間次元のデータとを蓄積する。
時間次元のデータは、当該時間次元のデータの情報源である事象を識別するための事象の識別子と時間次元の情報とを含む。時間次元の情報は、バッカス・ナウア記法(RFC5234)を用いて示すと、以下の通りである:
時間次元の情報 = 外観時間 *内実時間
外観時間 = 外観時間ID 開始時刻 終了時刻
内実時間 = 内実時間ID 開始時刻 終了時刻
開始時刻 = 時刻
終了時刻 = 時刻 / ”継続”。
図2は、この時間次元の情報を説明するための模式図である。なお、同図では、3個の事象を同じ参照符号「P」で示しているが、それぞれ個別の事象である。
外観時間ATは、事象Pの生成消滅による時間的変化を表現したものであり、事象Pの生成から消滅までの存続期間を表している。この外観時間ATは、全ての事象Pに共通の時点t0を原点とする絶対的な時間系を基準としている。
内実時間TTは、事象Pの状態遷移による時間的変化を表現したものであり、事象Pのある状態から別の状態へ遷移するまでの状態維持期間を表している。この内実時間TTは、その事象Pの外観時間ATの開始時点(t1,t2,t3,等)を原点とする相対的な時間系を基準としている。
また、空間次元のデータは、当該空間次元のデータの情報源である事象を識別するための事象の識別子と、その事象の時間次元のデータを識別するための時間次元の識別子と、空間次元の情報と、を含む。空間次元の情報は、バッカス・ナウア記法(RFC5234)を用いて示すと、以下の通りである:
空間次元の情報 = [幾何形状]((地理学的空間 工学的空間) / 地理学的空間 / 工学的空間)
幾何形状 = 点 / 線 / 面 / ポリゴン / 住所構造
地理学的空間 = 幾何形状の重心位置
工学的空間 = [幾何形状の重心] 構造
構造 = 事象間の関係 事象の識別子。
図3は、この空間次元の情報を説明するための模式図である。
地理学的空間GS(図3では簡略化のため事象P1の地理学的空間GSのみを示している)は、事象Pの生成消滅による空間的変化を表現したものであり、事象Pの形状と位置を表している。この地理学的空間GSは、全ての事象Pに共通の単一の位置を原点Oとするグローバルな座標系(x,y,z)を基準とする絶対空間である。
工学的空間は、事象Pの状態遷移による空間的変化を表現したものである。この工学的空間は、その事象P(図3では代表して事象P2を示している)が属する事象集合PGに共通の単一の位置を原点(o2)とするローカルな座標系(x2,y2,z2)を基準とする相対空間である。工学的空間は、事象集合PGにおける事象Pの幾何形状と位置を表す工学的空間ESfと、事象集合PGにおける事象P間の関係である構造を表す工学的空間ESsと、を含む。
複数の第2要素データベース142は、主題に依存する複数種別ごとに構成され、それぞれ、複数の固有次元のデータを蓄積する。複数の固有次元のデータは、主題ごとに蓄積される。各固有次元のデータは、当該固有次元のデータの情報源である事象を識別するための事象の識別子と、その事象の時間次元のデータを識別するための時間次元の識別子と、主題に依存する種別の固有次元の情報と、を含む。
複数の第3要素データベース143は、主題に依存する複数種別ごとに構成され、それぞれ、時間次元のデータ、空間次元のデータ及び固有次元のデータにより識別される、複数種別の特性を表す事象の特性のデータを蓄積する。複数種別の特性を表す事象の特性のデータは、主題ごとに蓄積される。各事象の特性のデータは、当該事象の特性のデータの情報源である事象を識別するための事象の識別子と、その事象の時間次元のデータを識別するための時間次元の識別子と、その事象の空間次元のデータを識別するための空間次元の識別子と、その事象の固有次元のデータを識別するための固有次元のデータの識別子と、主題に依存する複数種別の特性を表す事象の特性の情報と、を含む。
なお、要素データベース14へのデータの登録手法については、本発明では問わない。どのような手法を用いても、上記のようなデータが要素データベース14に登録されさえすれば良い。
OLAP操作実行部11は、クライアント20から送信されてきたOLAP操作と引数とを受信し、それらに従って多次元データベース管理部12に多次元データの操作を指示する。そして、OLAP操作実行部11は、多次元データベース管理部12から操作結果を受けて、クライアント20にその操作結果を送信する。
多次元データベース管理部12は、OLAP操作実行部11からの多次元データの操作指示に対し、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、その操作結果をOLAP操作実行部11に返却する。
このように、多次元データベース管理部12は、事象を体現するデータとしての、生成消滅及び/または状態遷移による時間的、空間的変化を体現する時間次元、空間次元及び主題に依存する複数種別の固有次元のデータと、その時間次元、空間次元及び固有次元のデータにより識別される主題に依存する複数種別の特性を表すデータとを、それらデータの情報源である事象を識別するための事象の識別子と対応付けて、主題ごとに構築した多次元キューブに蓄積及び管理する。すなわち、多次元データベース管理部12は、データの種別、特性及び用途に応じて、事象を体現するデータを、複数の異種データベースである第1乃至第3要素データベース141、142及び143に分散して蓄積する。そして、多次元データベース管理部12は、それら複数の異種データベースをデータカタログ13を用いて管理する。こうすることにより、多次元データベース管理部12は、多次元キューブをモノリシックな多次元データベースとして機能させることができる。
図4は、第1実施形態に係るデータ分析処理装置10をコンピュータによって実現する場合の構成の一例を、図1に示した構成と関連付けて示すブロック図である。
データ分析処理装置10は、例えばサーバコンピュータ等からなり、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサ101を有する。そして、このハードウェアプロセッサ101に対し、プログラムメモリ102、データメモリ103、及び通信インタフェース104を、バス105を介して接続したものとなっている。
プログラムメモリ102は、記憶媒体として、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の随時書込み及び読出しが可能な不揮発性メモリと、ROM(Read Only Memory)等の不揮発性メモリとを組み合わせて使用したものである。このプログラムメモリ102には、ハードウェアプロセッサ101をOLAP操作実行部11及び多次元データベース管理部12として機能させるためのデータ分析処理プログラムが格納されている。すなわち、このプログラムメモリ102に格納されたデータ分析処理プログラムを、ハードウェアプロセッサ101に実行させることにより、ソフトウェアによる処理機能部として、OLAP操作実行部11及び多次元データベース管理部12が実現されることができる。
なお、OLAP操作実行部11及び多次元データベース管理部12は、ハードウェアプロセッサ101の代わりに、あるいはそれに加えて、ASIC(Application Specific Integrated Circuit)やFPGA(field-programmable gate array)などの集積回路を含む、他の多様な形式で、実現されても良い。
データメモリ103は、記憶媒体として、例えば、HDDまたはSSD等の随時書込み及び読出しが可能な不揮発性メモリと、RAM(Random Access Memory)等の揮発性メモリとを組み合わせて使用したストレージであり、各種処理を行う過程で取得及び作成されたデータを記憶するために用いられる。データメモリ103の記憶領域は、データカタログ13と要素データベース14とを備えることができる。
通信インタフェース104は、LAN(Local Area Network)やインターネット等のネットワークNETに接続するための通信装置を含む。ハードウェアプロセッサ101は、この通信インタフェース104により、ネットワークNETを介して、クライアント20から送信されてくるOLAP操作と引数とを受信すること、及び、クライアント20に操作結果を送信することができる。
なお、データ分析処理プログラムは、プログラムメモリ102に予め記憶されていなくても良い。データ分析処理プログラムは、非一時的なコンピュータ可読媒体に記録して、あるいは、ネットワークを通して、データ分析処理装置10に提供されることも可能である。こうして提供されたデータ分析処理プログラムは、プログラムメモリ102に格納されることができる。あるいは、提供されたデータ分析処理プログラムは、ストレージであるデータメモリ103に格納されて、必要に応じてハードウェアプロセッサ101で実行されることで、ハードウェアプロセッサ101がOLAP操作実行部11及び多次元データベース管理部12として機能することも可能である。
(動作)
次に、以上のように構成されたデータ分析処理装置10の処理動作を説明する。
まず、データ分析処理装置10の動作の概略を説明する。図5は、第1実施形態に係るデータ分析処理装置10の動作の一例を説明するためのシーケンス図である。
OLAP操作実行部11は、クライアント20から、OLAP操作と引数を受信すると、そのOLAP操作と引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。
多次元データベース管理部12は、この多次元データの操作の指示に応じて、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、OLAP操作実行部11に、その多次元データの操作の操作結果を返却する。
OLAP操作実行部11は、図5に破線で囲って「LOOP」として示すように、上記の受信したOLAP操作の内容に応じて、上記多次元データベース管理部12への指示を繰り返す。
そして、OLAP操作実行部11は、OLAP操作の内容に対応する最終的な操作結果が取得できた段階で、そのOLAP操作の操作結果を、クライアント20に返却する。
次に、多次元データベース管理部12の動作の詳細を説明する。図6は、多次元データベース管理部12が、複数の異種データベースをモノリシックな多次元データベースとして機能させる動作の一例を説明するためのフローチャートである。
多次元データベース管理部12は、OLAP操作実行部11から多次元データの操作指示の受信待ちとなっている(ステップS121)。そして、それを受信すると、多次元データベース管理部12は、操作するべきデータをキーとしてデータカタログ13を検索して、操作するべきデータが格納されている要素データベース14、要素データベース14へのアクセス方法、及び、操作結果の解釈方法を取得する(ステップS122)。
そして、多次元データベース管理部12は、取得した要素データベース14に対し、取得したアクセス方法でアクセスして、当該要素データベース14を操作する(ステップS123)。これにより要素データベース14から操作結果を受信すると、多次元データベース管理部12は、その操作結果を、取得した解釈方法で変換する(ステップS124)。例えば、操作結果がデータであった場合は、多次元データベース管理部12は、解釈方法に従って、データ様式を変換する。操作結果がステータスであった場合は、多次元データベース管理部12は、解釈方法に従って、ステータスの表現を変換する。
そして、多次元データベース管理部12は、この変換した操作結果を、OLAP操作実行部11に返却する(ステップS125)。
次に、OLAP操作実行部11の動作の詳細を説明する。図7は、OLAP操作実行部が、クライアント20からOLAP操作と引数とを受信した後の、多次元キューブに対してOLAP操作を実行する場合の動作の一例を説明するためのフローチャートである。
OLAP操作実行部11は、まず、受信したOLAP操作が、多次元キューブの時間次元のデータに対するデータの選択処理であるか否かを判断する(ステップS111)。そうであれば、OLAP操作実行部11は、時間次元データ選択処理を実行する(ステップS112)。この時間次元データ選択処理の詳細については後述する。
上記ステップS111において時間次元のデータに対するデータの選択処理ではないと判断した場合、OLAP操作実行部11は、受信したOLAP操作が、多次元キューブの空間次元のデータに対するデータの選択処理であるか否かを判断する(ステップS113)。そうであれば、OLAP操作実行部11は、空間次元データ選択処理を実行する(ステップS114)。この空間次元データ選択処理の詳細についても後述する。
上記ステップS113において空間次元のデータに対するデータの選択処理ではないと判断した場合、OLAP操作実行部11は、受信したOLAP操作が、多次元キューブの事象の識別子に対するデータの選択処理であるか否かを判断する(ステップS115)。そうであれば、OLAP操作実行部11は、識別子データ選択処理を実行する(ステップS116)。この識別子データ選択処理の詳細についても後述する。
上記ステップS115において事象の識別子に対するデータの選択処理ではないと判断した場合、OLAP操作実行部11は、受信したOLAP操作が、多次元キューブのデータに対するデータの分類処理であるか否かを判断する(ステップS117)。そうであれば、OLAP操作実行部11は、データ分類処理を実行する(ステップS118)。このデータ分類処理の詳細についても後述する。
上記ステップS111においてデータの分類処理でもないと判断した場合、OLAP操作実行部11は、受信したOLAP操作に応じたその他の処理を実行する(ステップS119)。このその他の処理については説明を省略する。
図8は、上記ステップS112で実行される時間次元データ選択処理の詳細の一例を説明するためのフローチャートである。
多次元キューブの時間次元のデータを非演算子としてデータを選択するOLAP操作では、引数は、一組の、非演算子としての時点あるいは期間と、演算子とを含む。OLAP操作実行部11は、この演算子の基準が、絶対的な時間系であるのか相対的な時間系であるのかを判断する(ステップS1121)。
絶対的な時間系を基準とする演算子であると判断した場合は、OLAP操作実行部11は、多次元キューブの外観時間あるいは絶対的な時間系に変換した内実時間に対して、一組の非演算子と演算子とを適用する(ステップS1122)。そして、OLAP操作実行部11は、それら適用する非演算子と演算子を引数として、データ選択操作を多次元データベース管理部12に指示する(ステップS1123)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。
このデータ選択操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14である第1要素データベース141を特定し、その特定した第1要素データベース141からデータを選択することとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくる操作結果である、選択されたデータを受け取る(ステップS1124)。
上記ステップS1121において相対的な時間系を基準とする演算子であると判断した場合は、OLAP操作実行部11は、多次元キューブの内実時間に対して、一組の非演算子と演算子とを適用する(ステップS1125)。その後、OLAP操作実行部11は、それら適用する非演算子と演算子を引数として、データ選択操作を多次元データベース管理部12に指示する(ステップS1123)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。そして、OLAP操作実行部11は、このデータ選択操作の指示を受けた多次元データベース管理部12から返却されてくる操作結果である、選択されたデータを受け取る(ステップS1124)。
図9は、上記ステップS114で実行される空間次元データ選択処理の詳細の一例を説明するためのフローチャートである。
多次元キューブの空間次元のデータを非演算子としてデータを選択するOLAP操作では、引数は、一組の、非演算子としての位置及び形状と、演算子とを含む。OLAP操作実行部11は、この演算子の基準が、グローバルな座標系であるのかローカルな座標系であるのかを判断する(ステップS1141)。
グローバルな座標系を基準とする演算子であると判断した場合は、OLAP操作実行部11は、多次元キューブの絶対空間あるいはグローバルな座標系に変換した相対空間に対して、一組の非演算子と演算子とを適用する(ステップS1142)。そして、OLAP操作実行部11は、それら適用する非演算子と演算子を引数として、データ選択操作を多次元データベース管理部12に指示する(ステップS1143)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。
このデータ選択操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14である第1要素データベース141を特定し、その特定した第1要素データベース141からデータを選択することとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくる操作結果である、選択されたデータを受け取る(ステップS1144)。
上記ステップS1141においてローカルな座標系を基準とする演算子であると判断した場合は、OLAP操作実行部11は、多次元キューブの相対空間に対して、一組の非演算子と演算子とを適用する(ステップS1145)。その後、OLAP操作実行部11は、それら適用する非演算子と演算子を引数として、データ選択操作を多次元データベース管理部12に指示する(ステップS1143)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。そして、OLAP操作実行部11は、このデータ選択操作の指示を受けた多次元データベース管理部12から返却されてくる操作結果である、選択されたデータを受け取る(ステップS1144)。
図10は、上記ステップS116で実行される識別子データ選択処理の詳細の一例を説明するためのフローチャートである。
多次元キューブのデータと対応付けられた、データの情報源である事象の識別子を非演算子としてデータを選択するOLAP操作では、引数は、一組の、非演算子としてのデータの情報源である事象の識別子の集合と、演算子とを含む。OLAP操作実行部11は、この多次元キューブのデータと対応付けられたデータの情報源である事象の識別子に対して、一組の非演算子と演算子を適用する(ステップS1161)。そして、OLAP操作実行部11は、それら適用する非演算子と演算子を引数として、データ選択操作を多次元データベース管理部12に指示する(ステップS1162)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。
このデータ選択操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14を特定し、その特定した要素データベース14からデータを選択することとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくる操作結果である、選択されたデータを受け取る(ステップS1163)。
図11は、上記ステップS118で実行されるデータ分類処理の詳細の一例を説明するためのフローチャートである。
多次元キューブのデータを非演算子としてデータを分類するOLAP操作では、引数は、複数組の非演算子と、演算子と、演算方法とを含む。OLAP操作実行部11は、この演算方法が個別であるのか全体であるのかを判断する(ステップS1181)。なお、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は、OLAP操作実行部11は、それらを論理演算子で結合して、引数とする。
演算方法が全体であると判断した場合は、OLAP操作実行部11は、データの情報源である事象の識別子と対応する多次元キューブのデータ及び非演算子のデータに対して、データの情報源である事象ごとにデータをグループ分けせずに、各組の非演算子と演算子に該当するデータを選択することで、データ全体を分類する、データ分類操作を多次元データベース管理部12に指示する(ステップS1182)。
このデータ分類操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14を特定し、その特定した要素データベースから、各組の非演算子と演算子に該当するデータを選択することとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくるデータ分類結果を受け取る(ステップS1183)。
上記ステップS1181において演算方法が個別であると判断した場合は、OLAP操作実行部11は、データの情報源である事象の識別子と対応する多次元キューブのデータ及び非演算子のデータに対して、データの情報源である事象ごとにデータをグループ分けする、グループ分け操作を多次元データベース管理部12に指示する(ステップS1184)。
このグループ分け操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14を特定し、その特定した要素データベースからデータをグループ分けすることとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくる操作結果である、グループ分け結果を受け取る(ステップS1185)。
OLAP操作実行部11は、この受け取ったグループ分け結果に基づいて、グループごとに各組の非演算子と演算子に該当するデータを選択することで、データを分類する、データ分類操作を多次元データベース管理部12に指示する(ステップS1186)。
このグループごとのデータ分類操作の指示を受けた多次元データベース管理部12は、上述したようにデータカタログ13を参照して操作対象の要素データベース14を特定し、その特定した要素データベースから、各組の非演算子と演算子に該当するデータを選択することとなる。そして、OLAP操作実行部11は、多次元データベース管理部12から返却されてくるデータ分類結果を受け取る(ステップS1183)。
(効果)
第1実施形態に係るデータ分析処理装置10は、生成消滅及び/または状態遷移による時間的及び空間的変化を体現する時間次元及び空間次元のデータを蓄積及び管理するとともに、時間次元、空間次元のデータを含む事象を体現するデータを、それらデータの情報源である事象を識別するための識別子と対応付けて蓄積及び管理し、多次元キューブに対してOLAP操作を実行するようにしている。このように、時間次元及び空間次元のデータを、データの情報源である事象を識別するための識別子と対応付けて蓄積及び管理することで、データの情報源である事象に基づいてデータを選択することができる。よって、データの情報源である事象やその事象の状態遷移に着目してデータを分析することが可能となる。
また、第1実施形態によれば、データを、データの種別、特性、用途に応じて複数の異種データベースである要素データベース14に分散して蓄積し、データカタログ13を用いて管理することにより、複数の要素データベース14をモノリシックな多次元データベースとして機能させるようにしている。このように、データをデータの種別、特性、用途に応じて蓄積及び管理することにより、多種多様な種別のデータを分析対象にすることが可能となる。
また、第1実施形態によれば、開始時点から終了時点までの存続期間を有するとともにこの存続期間中に少なくとも1つの状態を取る、事象を体現する時間次元のデータとして、事象を含む全ての事象に共通の単一の時点を原点とする絶対的な時間系を基準として、事象の存続期間を表す外観時間と、ある事象の外観時間の開始時点を原点とする相対的な時間系を基準として、その事象がある状態から別の状態へ遷移するまでの状態維持期間をそれぞれ表す少なくとも1つの内実時間と、を保有するようにしている。さらに、一組の非演算子としての時点あるいは期間と演算子とを引数として、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は論理演算子で結合し、多次元キューブから非演算子と演算子に該当する時間次元のデータを選択する場合に、絶対的な時間系を基準とする演算子の場合は、外観時間あるいは絶対的な時間系に変換した内実時間に対して非演算子と演算子を適用し、相対的な時間系を基準とする演算子の場合は、内実時間に対して非演算子と演算子を適用して、非演算子と演算子に該当するデータを選択するようにしている。よって、事象の状態遷移による時間的な変化を表現する、ある事象の外観時間の開始時点を原点とする相対的な時間系を基準とする、その事象の各状態の状態維持期間を保持し、事象の状態遷移による時間的な変化を表現する、事象の各状態の状態維持期間と相対的な時間系に基づいてデータを選択することができる。すなわち、事象が生成したときの時点を原点とすることで、何れの事象を情報源とするデータに対しても任意の非演算子と演算子を皆一様に適用してデータを選択できるために、事象の状態遷移に着目してデータを分析することが可能となる。
また、第1実施形態によれば、空間次元のデータとして、全ての事象に共通の単一の位置を原点とするグローバルな座標系を基準として、事象の位置と形状を表す絶対空間と、事象が属する事象集合に共通の単一の位置を原点とするローカルな座標系を基準として、その事象が属する事象集合における事象の位置と形状を表す相対空間とを、保有するようにしている。さらに、一組の非演算子としての位置と形状と演算子とを引数として、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は論理演算子で結合し、多次元キューブから非演算子と演算子に該当する空間次元のデータを選択する場合に、グローバルな座標系を基準とする演算子の場合は、絶対空間あるいはグローバルな座標系に変換した相対空間に対して非演算子と演算子を適用し、ローカルな座標系を基準とする演算子の場合は、相対空間に対して非演算子と演算子を適用して、非演算子と演算子に該当するデータを選択するようにしている。よって、事象の状態遷移による空間的な変化を表現する、ある事象が属する事象集合に共通の単一の位置を原点とするローカルな座標系を基準する、その事象が属する事象集合における事象の位置と形状とを保持し、事象の状態遷移による空間的な変化を表現する、事象が属する事象集合における事象の位置と形状とローカルな座標系に基づいてデータを選択することができる。すなわち、事象が生成したときの位置・形状を原点とすることで、何れの事象を情報源とするデータに対しても任意の非演算子と演算子を皆一様に適用してデータを選択できるために、事象の状態遷移に着目してデータを分析することが可能となる。
また、第1実施形態によれば、一組の非演算子としての事象の識別子の集合と演算子とを引数として、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は論理演算子で結合し、多次元キューブから非演算子と演算子に該当するデータを選択する場合に、データと対応付けられた事象の識別子に対して非演算子と演算子を適用して、非演算子と演算子に該当するデータを選択するようにしている。このように、データを、データの情報源である事象の識別子と対応付けて蓄積及び管理することで、データの情報源である事象に基づいてデータを選択することができる。よって、データの情報源である事象に着目してデータを分析することが可能となる。
また、第1実施形態によれば、複数組の非演算子と演算子と演算方法とを引数として、一組の非演算子と演算子が複数の非演算子と演算子で構成される場合は論理演算子で結合し、多次元キューブから各組の非演算子と演算子に該当するデータを選択することでデータを分類する場合に、演算方法が個別の場合は、情報源である事象の識別子と対応付けられたデータに対して、データの情報源である事象ごとにデータをグループ分けしてからグループごとにデータを分類することで、データの情報源である事象ごとにデータを分類するようにしている。また、演算方法が全体の場合は、情報源である事象の識別子と対応付けられたデータに対して、データの情報源である事象ごとにデータをグループ分けせずに分類することで、データ全体を分類するようにしている。このように、データを、データの情報源である事象の識別子と対応付けて蓄積及び管理することで、データの情報源である事象に基づいてデータを選択したり、データの情報源である事象ごとにデータを分類したりすることができる。よって、データの情報源である事象に着目してデータを分析することが可能となる。
[第2実施形態]
(構成)
図12は、本発明の第2実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。第1実施形態と対応する構成については、第1実施形態と同様の符号を付すことで、その説明を省略する。
第2実施形態に係るデータ分析処理装置10は、第1実施形態の構成に加えて、OLAP操作連携部15と引継データ16とを備える。
OLAP操作連携部15は、ある主題の多次元キューブに対して実行したOLAP操作の引数あるいは結果を引継データ16として記録する。OLAP操作実行部11は、このOLAP操作連携部15から取得した引継データ16として記録した引数あるいは結果を、他の主題に対して実行するOLAP操作の引数として利用することができる。
第2実施形態に係るデータ分析処理装置10をコンピュータによって実現する場合の構成は、図4に示した第1実施形態のそれと同様である。但し、プログラムメモリ102またはデータメモリ103に記憶されるデータ分析処理プログラムは、ハードウェアプロセッサ101をOLAP操作連携部15として機能させる命令コードを含む。また、データメモリ103の記憶領域は、引継データ16を備える。
(動作)
図13A及び図13Bは、それぞれ、第2実施形態に係るデータ分析処理装置10の動作の一例を説明するためのシーケンス図である。図13Aは、引継データ16をOLAP操作の引数に使用しない場合を示し、図13Bは、引継データ16をOLAP操作の引数に使用する場合を示している。なお、これらの図において、簡略化のため、データカタログ13及び要素データベース14は省略している。
引継データ16をOLAP操作の引数に使用しない場合には、図13Aに示すように、OLAP操作実行部11は、クライアント20から、OLAP操作と引数を受信すると、そのOLAP操作と引数をOLAP操作連携部15に送信する。OLAP操作連携部15は、受信したOLAP操作と引数を対応付けて、引継データ16として記録する。
その後、OLAP操作実行部11は、第1実施形態で説明したように、クライアント20から受信したOLAP操作と引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。
多次元データベース管理部12は、この多次元データの操作の指示に応じて、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、OLAP操作実行部11に、その多次元データの操作の操作結果を返却する。OLAP操作実行部11は、上記の受信したOLAP操作の内容に応じて、上記多次元データベース管理部12への指示を繰り返す。
そして、OLAP操作実行部11は、OLAP操作の内容に対応する最終的な操作結果が取得できた段階で、OLAP操作連携部15に、その取得したOLAP操作の操作結果を送信する。OLAP操作連携部15は、引継データ16として記録している上記クライアント20からのOLAP操作と引数と組になるようにして、受信したOLAP操作の操作結果を、引継データ16として記録する。このように、引継データ16として、ある主題の多次元キューブに対するOLAP操作の引数として指定した非演算子、演算子及び演算方法が記録されると共に、そのOLAP操作の結果として得られた次元のデータ、データの情報源である事象の識別子が記録されることができる。
その後、OLAP操作実行部11は、そのOLAP操作の操作結果を、クライアント20に返却する。
このように、OLAP操作実行部11は、引継データ16を使用しない場合であっても、クライアント20からのOLAP操作及び引数と、それによる多次元データベースの操作結果とを、引継データ16として記録する。
そして、OLAP操作実行部11は、このようにして記録した引継データ16を利用することができる。すなわち、引継データ16をOLAP操作の引数に使用する場合には、図13Bに示すように、OLAP操作実行部11は、クライアント20から、OLAP操作と引数を受信すると、そのOLAP操作と引数をOLAP操作連携部15に送信する。OLAP操作連携部15は、受信したOLAP操作と引数を対応付けて、引継データ16として記録する。
その後、OLAP操作実行部11は、クライアント20からのOLAP操作と引数において、記録されている引継データ16も引数として使用することが指定されていた場合は、OLAP操作連携部15から、その指定された事前に記録されている引継データ16を取得する。
そして、OLAP操作実行部11は、クライアント20から受信したOLAP操作及び引数と、この引継データ16から取得した引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。多次元データベース管理部12は、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、OLAP操作実行部11に多次元データの操作の操作結果を返却する。OLAP操作実行部11は、OLAP操作の内容に応じて、さらに多次元データの操作を指示することで、処理を繰り返すことができる。
そして、OLAP操作実行部11は、OLAP操作の内容に対応する最終的な操作結果が取得できた段階で、OLAP操作連携部15に、その取得したOLAP操作の操作結果を送信する。OLAP操作連携部15は、引継データ16として記録している上記クライアント20からのOLAP操作と引数と組になるようにして、受信したOLAP操作の操作結果を、引継データ16として記録する。
その後、OLAP操作実行部11は、そのOLAP操作の操作結果を、クライアント20に返却する。
図14は、OLAP操作実行部11による、引継データ16の使用に係わる動作の一例を説明するためのフローチャートである。
OLAP操作実行部11は、クライアント20からのOLAP操作と引数において、記録されている引継データ16も引数として使用することが指定されているか否かを判断する(ステップS1110)。引継データ16を使用することを指定されていないと判断した場合、すなわち、図13Aに示したような場合には、OLAP操作実行部11は、第1実施形態で説明したような、クライアント20からOLAP操作と引数とに従った、多次元キューブに対するOLAP操作を実行することとなる。
上記ステップS1110において引継データ16も引数として使用することが指定されていると判断した場合、すなわち、図13Bに示したような場合には、OLAP操作実行部11は、さらに、次のような判断を行う。すなわち、OLAP操作実行部11は、記録されている引継データ16のうち、OLAP操作の引数として指定されていた非演算子、演算子及び演算方法を引数として使用することが指定されているのか、OLAP操作の操作結果として得られた次元のデータあるいはデータの情報源である事象の識別子を引数として使用することが指定されているのかを判断する(ステップS1111)。
OLAP操作の引数として指定されていた非演算子、演算子及び演算方法を引数として使用することが指定されていると判断した場合は、OLAP操作実行部11は、OLAP操作連携部15から引継データ16、すなわち、OLAP操作の引数として指定されていた非演算子、演算子及び演算方法を取得する(ステップS1112)。そして、OLAP操作実行部11は、クライアント20からのOLAP操作及び引数と、この引継データ16(OLAP操作の引数として指定されていた非演算子、演算子、演算方法)とから、多次元データベース管理部12に指示する多次元データの操作を組み立てる(ステップS1113)。その後は、その組み立てた多次元データの操作を多次元データベース管理部12に指示することで、多次元キューブに対するOLAP操作を実行していくことになる。
上記ステップS1111においてOLAP操作の操作結果として得られた次元のデータあるいはデータの情報源である事象の識別子を引数として使用することが指定されていると判断した場合は、OLAP操作実行部11は、OLAP操作連携部15から引継データ16、すなわち、OLAP操作の操作結果として得られた次元のデータあるいはデータの情報源である事象の識別子を取得する(ステップS1114)。そして、OLAP操作実行部11は、クライアント20からのOLAP操作及び引数と、この引継データ16(OLAP操作の操作結果として得られた次元のデータあるいはデータの情報源である事象の識別子)とから、多次元データベース管理部12に指示する多次元データの操作を組み立てる(ステップS1115)。その後は、その組み立てた多次元データの操作を多次元データベース管理部12に指示することで、多次元キューブに対するOLAP操作を実行していくことになる。
(効果)
第2実施形態に係るデータ分析処理装置10は、第1実施形態の効果に加えて、以下の効果を有する。
第2実施形態に係るデータ分析処理装置10は、ある主題の多次元キューブに対して実行したOLAP操作の引数あるいは結果を引継データ16として記録し、それらを他の主題の多次元キューブに対して実行するOLAP操作の引数として選択的に利用するようにしている。これにより、第2実施形態によれば、多次元キューブに対するOLAP操作を連携し、多次元キューブを関連付けて分析することが可能となる。
ここで、ある主題の多次元キューブに対して実行したOLAP操作の引数は、ある主題の多次元キューブに対するOLAP操作の引数として指定した非演算子、演算子及び演算方法を含むことができる。また、ある主題の多次元キューブに対して実行したOLAP操作の結果は、ある主題の多次元キューブに対するOLAP操作の結果として得られた次元のデータ、データの情報源である事象の識別子を含むことができる。
[第3実施形態]
(構成)
図15は、本発明の第3実施形態に係るデータ分析処理装置の構成の一例を示すブロック図である。第2実施形態と対応する構成については、第2実施形態と同様の符号を付すことで、その説明を省略する。
第3実施形態に係るデータ分析処理装置10は、第2実施形態の構成に加えて、OLAP操作管理部17と履歴データ18とを備える。
OLAP操作管理部17は、多次元キューブに対するOLAP操作を履歴データ18として記録する。OLAP操作実行部11は、OLAP操作を任意に再実行するための部品として、このOLAP操作管理部17から取得した履歴データ18を利用することができる。
第3実施形態に係るデータ分析処理装置10をコンピュータによって実現する場合の構成は、図4に示した第1実施形態のそれと同様である。但し、プログラムメモリ102またはデータメモリ103に記憶されるデータ分析処理プログラムは、ハードウェアプロセッサ101をOLAP操作管理部17として機能させる命令コードを含む。また、データメモリ103の記憶領域は、履歴データ18を備える。
(動作)
図16A及び図16Bは、それぞれ、第3実施形態に係るデータ分析処理装置10の動作の一例を説明するためのシーケンス図である。図16Aは、履歴データ18を利用したOLAP操作の再実行を行わない場合を示し、図16Bは、履歴データ18を利用したOLAP操作の再実行を行う場合を示している。なお、これらの図において、簡略化のため、クライアント20、データカタログ13及び要素データベース14は省略している。
履歴データ18を利用したOLAP操作の再実行を行わない場合には、図16Aに示すように、OLAP操作実行部11は、クライアント20から、OLAP操作と引数を受信すると、そのOLAP操作と引数をOLAP操作管理部17に送信する。OLAP操作管理部17は、受信したOLAP操作と引数を対応付けて、履歴データ18として記録する。
また、OLAP操作実行部11は、クライアント20からのOLAP操作と引数をOLAP操作連携部15に送信する。OLAP操作連携部15は、受信したOLAP操作と引数とを対応付けて、引継データ16として記録する。
その後、OLAP操作実行部11は、第2実施形態で説明したように、クライアント20からのOLAP操作と引数において、記録されている引継データ16も引数として使用することが指定されていない場合には、クライアント20から受信したOLAP操作と引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。また、記録されている引継データ16も引数として使用することが指定されていた場合には、OLAP操作実行部11は、OLAP操作連携部15から引継データ16を取得して、クライアント20から受信したOLAP操作及び引数と、この引継データ16から取得した引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。つまり、図16Aに破線で囲って「OPT」として示すように、引継データ16の使用はオプションである。
多次元データベース管理部12は、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、OLAP操作実行部11に多次元データの操作の操作結果を返却する。OLAP操作実行部11は、OLAP操作の内容に応じて、さらに多次元データの操作を指示することで、処理を繰り返すことができる。
そして、OLAP操作実行部11は、OLAP操作の内容に対応する最終的な操作結果が取得できた段階で、OLAP操作連携部15に、その取得したOLAP操作の操作結果を送信する。OLAP操作連携部15は、引継データ16として記録している上記クライアント20からのOLAP操作と引数と組になるようにして、受信したOLAP操作の操作結果を、引継データ16として記録する。
その後、OLAP操作実行部11は、そのOLAP操作の操作結果を、クライアント20に返却する。
このように、OLAP操作実行部11は、履歴データ18を利用したOLAP操作の再実行を行わない場合であっても、クライアント20からのOLAP操作及び引数を、履歴データ18として記録する。
そして、OLAP操作実行部11は、このようにして記録した履歴データ18を利用することができる。すなわち、履歴データ18を利用したOLAP操作の再実行を行う場合には、図16Bに示すように、OLAP操作実行部11は、クライアント20から、OLAP操作と引数を受信すると、そのOLAP操作と引数をOLAP操作管理部17に送信する。OLAP操作管理部17は、受信したOLAP操作と引数を対応付けて、履歴データ18として記録する。
その後、OLAP操作実行部11は、クライアント20からのOLAP操作と引数において、記録されている履歴データ18を利用いてOLAP操作を再実行することが指定されていた場合は、OLAP操作管理部17から、その指定された事前に記録されている履歴データ18を取得する。
そして、OLAP操作実行部11は、クライアント20から受信したOLAP操作及び引数と、この取得した履歴データ18として記録されているOLAP操作と引数とを、OLAP操作連携部15に送信する。OLAP操作連携部15は、受信したOLAP操作と引数とを対応付けて、引継データ16として記録する。
その後、OLAP操作実行部11は、クライアント20からのOLAP操作と引数において、記録されている引継データ16も引数として使用することが指定されていない場合には、クライアント20から受信したOLAP操作及び引数と、取得した履歴データ18とに基づく多次元データの操作を、多次元データベース管理部12に指示する。
また、図16Bに「OPT」として示すように、記録されている引継データ16も引数として使用することが指定されていた場合には、OLAP操作実行部11は、OLAP操作連携部15から引継データ16を取得する。そして、OLAP操作実行部11は、クライアント20から受信したOLAP操作及び引数と、この引継データ16から取得した引数と、取得した履歴データ18と、に基づく多次元データの操作を、多次元データベース管理部12に指示する。
なお、クライアント20からのOLAP操作と引数において、記録されている引継データ16も引数として使用することが指定されていない場合であっても、取得した事前に記録された履歴データ18において、引継データ16も引数として使用することが指定されている場合もあり得る。そのような場合には、結果的に、OLAP操作実行部11は、引継データ16を取得して、クライアント20から受信したOLAP操作及び引数と、引継データ16から取得した引数と、履歴データ18と、に基づく多次元データの操作を、多次元データベース管理部12に指示することとなる。
そして、OLAP操作実行部11は、クライアント20から受信したOLAP操作及び引数と、この引継データ16から取得した引数とに基づく多次元データの操作を、多次元データベース管理部12に指示する。多次元データベース管理部12は、データカタログ13を参照して操作対象の要素データベース14を特定し、要素データベース14を操作する。そして、多次元データベース管理部12は、OLAP操作実行部11に多次元データの操作の操作結果を返却する。OLAP操作実行部11は、OLAP操作の内容に応じて、さらに多次元データの操作を指示することで、処理を繰り返すことができる。
そして、OLAP操作実行部11は、OLAP操作の内容に対応する最終的な操作結果が取得できた段階で、OLAP操作連携部15に、その取得したOLAP操作の操作結果を送信する。OLAP操作連携部15は、引継データ16として記録している上記クライアント20からのOLAP操作と引数と組になるようにして、受信したOLAP操作の操作結果を、引継データ16として記録する。
また、履歴データ18として記録されているOLAP操作が、多次元データの操作を複数行うものである場合もあり得る。そのような場合には、図16Bに破線で囲って「LOOP」として示すように、OLAP操作実行部11は、引継データ16の記録からの動作を繰り返す。
そして、全てのOLAP操作に対する操作結果が得られたならば、OLAP操作実行部11は、それらのOLAP操作の操作結果を、クライアント20に返却する。
図17は、OLAP操作実行部11による、履歴データ18の使用に係わる動作の一例を説明するためのフローチャートである。
OLAP操作実行部11は、クライアント20からのOLAP操作と引数において、記録されている履歴データ18を利用したOLAP操作の再実行を行うことが指定されているか否かを判断する(ステップS1120)。履歴データ18を利用したOLAP操作の再実行を行うことが指定されていないと判断した場合、すなわち、図16Aに示したような場合には、OLAP操作実行部11は、第2実施形態で説明したような、クライアント20からOLAP操作及び引数と引継データ16として記録されている引数とに従った、多次元キューブに対するOLAP操作を実行することとなる。
上記ステップS1120において引継データ16を利用したOLAP操作の再実行を行うことが指定されていると判断した場合、すなわち、図16Bに示したような場合には、OLAP操作実行部11は、OLAP操作管理部17から履歴データ18、すなわち、OLAP操作とOLAP操作の引数として指定されていた非演算子、演算子及び演算方法を取得する(ステップS1121)。そして、OLAP操作実行部11は、クライアント20からのOLAP操作及び引数と、この履歴データ18(OLAP操作とOLAP操作の引数として指定されていた非演算子、演算子、演算方法)とから、多次元データベース管理部12に指示する多次元データの操作を組み立てる(ステップS1122)。その後は、その組み立てた多次元データの操作を多次元データベース管理部12に指示することで、多次元キューブに対するOLAP操作を実行していくことになる。
(効果)
第3実施形態に係るデータ分析処理装置10は、第1及び第2実施形態の効果に加えて、以下の効果を有する。
第3実施形態に係るデータ分析処理装置10は、多次元キューブに対するOLAP操作を履歴データ18として記録し、この記録したOLAP操作を部品として、OLAP操作実行部11に任意に再実行させるようにしている。これにより、分析工程の巻き戻しと再試行(トライ&エラー)、比較及び/または評価、再利用などにより、分析作業を支援することが可能となる。また、分析工程の自動実行により、データを実時間で分析することが可能となる。
なお、この発明は、上記実施形態そのままに限定されるものではない。
例えば、OLAP操作実行部11は、例えば図5に示すように、全てのOLAP操作に対する操作結果を纏めてクライアント20に返却するものとしているが、各OLAP操作が終了する度に、その操作結果をクライアント20に返却するようにしても良い。
また、第3実施形態の構成において、OLAP操作連携部15及び引継データ16を省略しても良い。
要するにこの発明は、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても良い。さらに、異なる実施形態に亘る構成要素を適宜組み合わせても良い。
10…データ分析処理装置
11…OLAP操作実行部
12…多次元データベース管理部
13…データカタログ
14…要素データベース
15…OLAP操作連携部
16…引継データ
17…OLAP操作管理部
18…履歴データ
20…クライアント
101…ハードウェアプロセッサ
102…プログラムメモリ
103…データメモリ
104…通信インタフェース
105…バス
141…第1要素データベース
142…第2要素データベース
143…第3要素データベース
AT…外観時間
ESf,ESs…工学的空間
GS…地理学的空間
NET…ネットワーク
P,P1,P2…事象
PG…事象集合
TT…内実時間

Claims (13)

  1. 生成消滅及び状態遷移の少なくとも一方により時間的及び空間的の少なくとも一方に変化する実世界の事象について、前記事象を体現するデータを多次元キューブに写像してオンライン分析処理(OLAP)操作により分析するデータ分析処理装置であって、
    前記事象を体現するデータとしての、前記生成消滅及び状態遷移の少なくとも一方による時間的、空間的変化を体現する時間次元、空間次元及び主題に依存する複数種別の固有次元のデータと、前記時間次元、空間次元及び固有次元の前記データにより識別される前記主題に依存する前記複数種別の特性を表すデータとを、それらデータの情報源である前記事象を識別するための事象の識別子と対応付けて、前記主題ごとに構築した多次元キューブに蓄積及び管理する多次元データベース管理部と、
    前記多次元キューブに対して前記OLAP操作を実行するOLAP操作実行部と、
    を備える、データ分析処理装置。
  2. 前記多次元データベース管理部は、
    データの種別、特性及び用途に応じて、前記事象を体現するデータを複数の異種データベースに分散して蓄積し、
    前記複数の異種データベースをデータカタログを用いて管理する、
    ことにより、前記多次元キューブをモノリシックな多次元データベースとして機能させる、請求項1に記載のデータ分析処理装置。
  3. 前記多次元データベース管理部は、開始時点から終了時点までの存続期間を有するとともに前記存続期間中に少なくとも1つの状態を取る前記事象を体現する前記時間次元のデータとして、
    前記事象を含む全ての事象に共通の単一の時点を原点とする絶対的な時間系を基準として前記事象の前記存続期間を表す外観時間と、
    前記外観時間の開始時点を原点とする相対的な時間系を基準として前記事象がある状態から別の状態へ遷移するまでの状態維持期間をそれぞれ表す少なくとも1つの内実時間と、
    を保有する、請求項1に記載のデータ分析処理装置。
  4. 前記OLAP操作実行部は、非演算子として時点あるいは期間を用いるとき、
    演算子が前記絶対的な時間系を基準とする演算子である場合は、前記外観時間あるいは前記絶対的な時間系に変換した前記内実時間に対して、前記非演算子と前記演算子を適用して、前記非演算子と前記演算子に該当するデータを選択し、
    前記演算子が前記相対的な時間系を基準とする演算子である場合は、前記内実時間に対して、前記非演算子と前記演算子を適用して、前記非演算子と前記演算子に該当するデータを選択する、請求項3に記載のデータ分析処理装置。
  5. 前記多次元データベース管理部は、前記空間次元のデータのそれぞれとして、
    全ての事象に共通の単一の位置を原点とするグローバルな座標系を基準として前記事象の位置と形状を表す絶対空間と、
    前記事象が属する事象集合に共通の単一の位置を原点とするローカルな座標系を基準として、前記事象集合における前記事象の位置と形状を表す相対空間と、
    を保有する、請求項1に記載のデータ分析処理装置。
  6. 前記OLAP操作実行部は、非演算子として位置と形状を用いるとき、
    演算子が前記グローバルな座標系を基準とする演算子である場合は、前記絶対空間あるいは前記グローバルな座標系に変換した前記相対空間に対して、前記非演算子と前記演算子を適用して、前記非演算子と前記演算子に該当するデータを選択し、
    前記演算子が前記ローカルな座標系を基準とする演算子である場合は、前記相対空間に対して、前記非演算子と前記演算子を適用して、前記非演算子と前記演算子に該当するデータを選択する、請求項5に記載のデータ分析処理装置。
  7. 前記OLAP操作実行部は、非演算子としての前記事象の識別子の集合と演算子とを引数として用いて、前記多次元キューブから前記非演算子と前記演算子に該当するデータを選択するOLAP操作を実行するとき、前記事象の識別子に対して、前記非演算子と前記演算子を適用して、前記非演算子と前記演算子に該当するデータを選択する、請求項1に記載のデータ分析処理装置。
  8. 前記OLAP操作実行部は、複数組の非演算子及び演算子と、演算方法と、を引数として用いて、前記多次元キューブから各組の前記非演算子と前記演算子に該当するデータを選択することで前記データを分類するOLAP操作を実行するとき、
    前記演算方法が個別の場合は、前記事象の識別子と対応付けられた前記データに対して、前記事象ごとに前記データをグループ分けしてから、前記グループごとに前記データを分類することで、前記事象ごとに前記データを分類し、
    前記演算方法が全体の場合は、前記事象の識別子に対応付けられた前記データに対して、前記事象ごとに前記データをグループ分けせずに分類することで、前記データ全体を分類する、請求項1、4、6または7に記載のデータ分析処理装置。
  9. ある主題の多次元キューブに対して実行した前記OLAP操作の引数を記録し、この記録した前記引数を、他の主題に対して実行するOLAP操作の引数として利用するOLAP操作連携部をさらに備え、
    前記OLAP操作連携部は、
    ある主題の多次元キューブに対する前記OLAP操作の引数として指定した非演算子、演算子及び演算方法を記録し、
    それらを、他の主題の多次元キューブに対するOLAP操作の引数である前記非演算子、演算子及び演算方法として選択的に利用する、請求項1、4、6、7または8に記載のデータ分析処理装置。
  10. ある主題の多次元キューブに対して実行した前記OLAP操作の結果を記録し、この記録した前記結果を、他の主題に対して実行するOLAP操作の引数として利用するOLAP操作連携部をさらに備え、
    前記OLAP操作連携部は、
    ある主題の多次元キューブに対する前記OLAP操作の結果として得られた次元のデータと、そのデータに対応付けられた前記事象の識別子とを記録し、
    それらを、他の主題の多次元キューブに対するOLAP操作の引数である非演算子として選択的に利用する、請求項1、4、6、7または8に記載のデータ分析処理装置。
  11. ある主題の多次元キューブに対して実行した前記OLAP操作を記録し、前記OLAP操作実行部に、前記記録したOLAP操作を部品として任意に再実行させるOLAP操作管理部をさらに備える、請求項1、4、6、7、8、9または10に記載のデータ分析処理装置。
  12. 生成消滅及び状態遷移の少なくとも一方により時間的及び空間的の少なくとも一方に変化する実世界の事象について、前記事象を体現するデータを多次元キューブに写像してオンライン分析処理(OLAP)操作により分析するデータ分析処理装置が実行するデータ分析処理方法であって、
    前記データ分析処理装置が実行することによって、
    前記データ分析処理装置が、前記事象を体現するデータとしての、前記生成消滅及び状態遷移の少なくとも一方による時間的、空間的変化を体現する時間次元、空間次元及び主題に依存する複数種別の固有次元のデータと、前記時間次元、空間次元及び固有次元の前記データにより識別される前記主題に依存する前記複数種別の特性を表すデータとを、それらデータの情報源である前記事象を識別するための事象の識別子と対応付けて、記憶装置に前記主題ごとに構築した多次元キューブに蓄積及び管理し、
    前記データ分析処理装置が、前記多次元キューブに対して前記OLAP操作を実行する、
    データ分析処理方法。
  13. コンピュータのプロセッサを、請求項1乃至11の何れかに記載のデータ分析処理装置として機能させる、データ分析処理プログラム。
JP2021543822A 2019-09-02 2019-09-02 データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム Active JP7259973B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/034475 WO2021044497A1 (ja) 2019-09-02 2019-09-02 データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2021044497A1 JPWO2021044497A1 (ja) 2021-03-11
JP7259973B2 true JP7259973B2 (ja) 2023-04-18

Family

ID=74852344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021543822A Active JP7259973B2 (ja) 2019-09-02 2019-09-02 データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム

Country Status (3)

Country Link
US (1) US11899690B2 (ja)
JP (1) JP7259973B2 (ja)
WO (1) WO2021044497A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2023281699A1 (ja) * 2021-07-08 2023-01-12
WO2023073806A1 (ja) * 2021-10-26 2023-05-04 日本電信電話株式会社 データ分析処理装置、データ分析処理方法、およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129031A (ja) 2007-11-20 2009-06-11 Osaka Univ 多次元データ分析方法、多次元データ分析装置、及びプログラム
JP2011054156A (ja) 2009-08-31 2011-03-17 Accenture Global Services Gmbh 適応分析多次元処理システム
JP2018136963A (ja) 2014-11-19 2018-08-30 株式会社インフォメックス データ検索装置、データ検索方法、データ検索プログラム、及び記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2519021A1 (en) * 2005-09-13 2007-03-13 Cognos Incorporated System and method of providing date, arithmetic, and other functions for olap sources
US8838623B2 (en) * 2006-06-22 2014-09-16 International Business Machines Corporation System and method for locking context of sets of members in crosstabs
US9411874B2 (en) * 2012-06-14 2016-08-09 Melaleuca, Inc. Simplified interaction with complex database

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129031A (ja) 2007-11-20 2009-06-11 Osaka Univ 多次元データ分析方法、多次元データ分析装置、及びプログラム
JP2011054156A (ja) 2009-08-31 2011-03-17 Accenture Global Services Gmbh 適応分析多次元処理システム
JP2018136963A (ja) 2014-11-19 2018-08-30 株式会社インフォメックス データ検索装置、データ検索方法、データ検索プログラム、及び記録媒体

Also Published As

Publication number Publication date
WO2021044497A1 (ja) 2021-03-11
JPWO2021044497A1 (ja) 2021-03-11
US20220284043A1 (en) 2022-09-08
US11899690B2 (en) 2024-02-13

Similar Documents

Publication Publication Date Title
CN107239335B (zh) 分布式系统的作业调度系统及方法
US10769147B2 (en) Batch data query method and apparatus
CN108694195B (zh) 一种分布式数据仓库的管理方法及系统
US20140358977A1 (en) Management of Intermediate Data Spills during the Shuffle Phase of a Map-Reduce Job
US20210086354A1 (en) Process understanding for robotic process automation (rpa) using sequence extraction
CN113767388A (zh) 用于工作流分析和设计任务优化的技术
CN110928772A (zh) 一种测试方法及装置
JP7259973B2 (ja) データ分析処理装置、データ分析処理方法及びデータ分析処理プログラム
TW201512864A (zh) 平行樹狀型預測
KR101535813B1 (ko) 복합 이벤트 처리를 위한 이벤트 구성 규칙의 동적 업데이트를 위한 시스템 및 방법
CA2567947A1 (en) Layout generation method, information processing device, and program
JP4588295B2 (ja) シーケンス解析方法およびシーケンス解析装置
CN108133059A (zh) 含大规模低功率集群的异构数据库系统中联接的有效下推
JP2016100006A (ja) パフォーマンス試験のためのベンチマーク・アプリケーションを生成する方法および装置
JPWO2018143441A1 (ja) 情報処理システム及び情報処理方法
US9292405B2 (en) HANA based multiple scenario simulation enabling automated decision making for complex business processes
CN113641651A (zh) 一种业务数据管理方法、系统及计算机存储介质
JP5206268B2 (ja) ルール作成プログラム、ルール作成方法及びルール作成装置
JP6744272B2 (ja) 移行管理装置及び移行管理方法
KR20100022171A (ko) 스레드 지향 로깅 시스템에서 로그 저장 방법 및 장치
US20200210406A1 (en) Method and device for restoring missing operational data
KR101722643B1 (ko) Rdd 관리 방법, rdd 관리 장치 및 rdd 관리 프로그램을 저장하는 저장매체
KR20160047239A (ko) 혼합 워크로드 처리 환경에서 효율적인 데이터 저장을 위한 컬럼 그룹 선택방법 및 장치
US20130325365A1 (en) Buildable part pairs in an unconfigured product structure
KR101638048B1 (ko) 맵리듀스를 이용한 sql 질의처리방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221109

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230104

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230320

R150 Certificate of patent or registration of utility model

Ref document number: 7259973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150