JP6846356B2 - 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法 - Google Patents

表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法 Download PDF

Info

Publication number
JP6846356B2
JP6846356B2 JP2017558695A JP2017558695A JP6846356B2 JP 6846356 B2 JP6846356 B2 JP 6846356B2 JP 2017558695 A JP2017558695 A JP 2017558695A JP 2017558695 A JP2017558695 A JP 2017558695A JP 6846356 B2 JP6846356 B2 JP 6846356B2
Authority
JP
Japan
Prior art keywords
columns
cube
column
cube schema
directed graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017558695A
Other languages
English (en)
Other versions
JP2018536909A5 (ja
JP2018536909A (ja
Inventor
アルバーグ,ディマ
ベルヤエブ,ビクター
シェイクド,ガイ
ルビン,ガビー
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2018536909A publication Critical patent/JP2018536909A/ja
Publication of JP2018536909A5 publication Critical patent/JP2018536909A5/ja
Application granted granted Critical
Publication of JP6846356B2 publication Critical patent/JP6846356B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

著作権表示
この特許文書の開示の一部は、著作権保護の対象となるものを含んでいる。著作権者は、特許商標庁の特許ファイルまたは記録に掲載された特許文書または特許開示の複製に対しては異議を唱えないが、その他の場合、全ての著作権を留保する。
優先権の主張
本願は、2015年10月23日に出願され、「表形式データから、多次元データベース環境に使用されるキューブを自動的に推論するためのシステムおよび方法」と題された米国仮出願第62/245885号の優先権を主張する。当該出願は、参照により本明細書に組み込まれる。
発明の分野
本発明の実施形態は、一般的には、データベースおよびデータの格納に関し、具体的には、表形式データから、多次元データベース環境に使用されるキューブスキーマ(cube schema)を自動的に推論するためのシステムおよび方法に関する。
背景
多次元データベース、例えば、Oracle(登録商標)Essbaseは、複数の視点から観察され、分析され得る大量のデータを効率的且つ便利に格納および検索するために設計されている。このような多次元データベースは、多次元データを論理的に表すキューブを含むことができる。これらのキューブは、フラットファイルまたはデータベーステーブルに格納された表形式データから構築することができる。表形式データからキューブを構築するためには、ユーザまたはシステムが、表形式データ内の列間の関係および依存性を特定することによって、キューブのスキーマを抽出する必要がある。しかしながら、数百列からなる表形式データの場合、キューブを構築する際に使用されるスキーマを特定することは、困難である。
概要
一実施形態によれば、本明細書には、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法が記載される。システムは、キューブスキーマ推論要素を含むことができる。キューブスキーマ推論要素は、列方向の分割を連続的に行うことによって、表形式データ内の複数列のうち、各対の列の情報利得比を計算することができる。各対の列の情報利得比から、相互相関マトリックスを構築することができる。システムは、相互相関マトリックスに基づいて、複数列の間の関係を決定し、その関係を表す階層性有向グラフ(hierarchy directed graph)を作成することができる。さらに、システムは、階層性有向グラフを、多次元データベース環境内で表形式データをロードするためのキューブを作成するためまたは多次元データベース環境内で表形式データを既存のキューブにマッピングするために使用できるキューブスキーマに変換することができる。
一実施形態に従って、多次元データベース環境の一例を示す図である。 一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムを示す図である。 一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマの自動推論を示す図である。 一実施形態に従って、本発明のシステムを用いて、表形式データから、キューブスキーマを自動的に推論する例を示す図である。 一実施形態に従って、表形式データの列を複数のキューブ要素にマッピングするためのフローチャートを示す図である。 一実施形態に従って、表形式データの列を複数のキューブ要素にマッピングするためのフローチャートを示す図である。 一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するための方法を示す図である。 一実施形態に従って、本発明のシステムを使用することができる環境を示すアーキテクチャ図である。
詳細な説明
上記の特徴および実施形態は、他の特徴および実施形態と共に、以下の明細書、特許請求の範囲および添付図面を参照して、より明らかになるであろう。特定の詳細は、様々な実施形態の理解を提供するために記載される。しかしながら、これらの具体的な詳細がなくても、様々な実施形態を実施できることは明らかであろう。添付の明細書および図面は、限定的であることを意図していない。
多次元データベース環境、一例としてOracle(登録商標)Essbaseを含む多次元データベース環境を用いて、大量のデータ、場合によって複数のデータソースからの大量のデータを統合し、エンドユーザの特定の要求に応じて、フィルタされた情報をこれらのユーザに配信することができる。
図1は、一実施形態に従って、多次元データベース環境100の一例を示す図である。
図1に示すように、一実施形態によれば、データベース層(database tier)として動作する多次元データベース環境は、1つ以上の多次元データベースサーバシステム102を含むことができる。各々の多次元データベースサーバシステム102は、物理コンピュータリソースまたは要素104(例えば、マイクロプロセッサ/CPU、物理メモリ、ネットワーク要素)と、オペレーティングシステム106と、1つ以上の多次元データベースサーバ(例えば、Essbaseサーバ)110とを含む。
一実施形態によれば、中間層(middle tier)120は、1つ以上のサービス、例えば、プロバイダサービス122(例えば、Hyperionプロバイダサービス)、管理サービス124(例えば、Essbase管理サービス)、またはスタジオ/統合サービス126(例えば、Essbaseスタジオ/Essbase統合サービス)を含むことができる。中間層は、ODBC/JDBC127および128または他の種類のインターフェイスを介して、メタデータカタログ129および/または多次元データベース環境と共に使用される1つ以上のデータソース130(例えば、関係データベース)へのアクセスを提供することができる。
一実施形態によれば、1つ以上の多次元データベースサーバは、多次元データベースを提供するために、ODBC/JDBC132または他の種類のインターフェイスを介して、1つ以上のデータソースにアクセスすることができる。
一実施形態によれば、クライアント層(client tier)140は、1つ以上の多次元データベースクライアント142(例えば、Essbaseサーバクライアント)を含むことができる。これらの多次元データベースクライアント142は、多次元データベース(例えば、スマートビュー(Smart View)、スプレッドシートアドイン(Spreadsheet Add-in)、スマートサーチ(Smart Search)、管理サービス、MaxL、XMLA、CAPIまたはVB APIアプリケーション、Oracle(登録商標)ビジネスインテリジェンスエンタープライズ版Plus(Oracle Business Intelligence Enterprise Edition Plus)、または他の種類の多次元データベースクライアント)にアクセスすることができる。また、クライアント層は、中間層のサービスと共に使用されるコンソール、例えば、管理サービスコンソール144またはスタジオ/統合サービスコンソール146を含むこともできる。
一実施形態によれば、クライアント層、中間層層およびデータベース層の間の通信は、TCP/IP、HTTP、または他の種類のネットワーク通信プロトコルのうち1つ以上によって提供されてもよい。
一実施形態によれば、多次元データベースサーバは、1つ以上のデータソースからのデータを統合することによって、多次元データベース、データ構造またはキューブ150を提供することができる。多次元データベースサーバは、キューブ150を利用して、フィルタされた情報をエンドユーザに提供することができる。
一般的には、多次元データベース内の各データ値は、キューブのセルに格納される。キューブの次元上の座標を特定することによって、特定のデータ値を参照することができる。1つの次元上のメンバと1つ以上の他の各次元上のメンバとの交差点は、データ値を表す。
例えば、販売型ビジネスアプリケーションに使用され得るキューブ162を示す図1に示すように、クエリが「売上高」(Sales)を表す場合、システムは、このクエリを、全ての「売上高」データ値を含むデータベース内のデータ値164のスライスまたはレイヤとして解釈することができる。「売上高」は、「実績」(Actual)および「予算」(Budget)と交差している。多次元データベース内の特定のデータ値166を照会するために、クエリは、例えば「売上高、実績、一月」を指定することによって、各次元上のメンバを特定することができる。異なる方法でデータベースをスライスすることによって、様々な視点のデータを提供することができる。例えば、「二月」に対応するデータ値168のスライスは、時間/年次元が「二月」に固定された全てのデータ値を検査する。
データベースアウトライン
一実施形態によれば、多次元データベースの開発は、データベースアウトラインの作成から始まる。データベースアウトラインは、データベース内のメンバ間の構造関係を定義し、データベース内のデータを編成し、集約および数学関係を定義する。データベースアウトラインの階層木またはデータ構造において、各次元は、1つ以上のメンバを含み、各メンバは、さらに他のメンバを含むことができる。次元を指定することによって、個々のメンバの値を統合する方法をシステムに指示することができる。集約は、木の1つの分岐内のメンバ群を意味する。
次元およびメンバ
一実施形態によれば、次元は、データベースアウトラインにおいて最も高い集約レベルを表す。標準次元を選択して、部門別機能(例えば、時間、勘定科目、製品ライン、市場、部門)に関連する事業計画の構成要素を表すことができる。標準次元に関連付けられた属性次元によって、ユーザは、メンバの属性または特性に基づいて、標準次元のメンバをグループ化および分析することができる。メンバ(商品A、商品B、商品Cなど)は、次元の個々の構成要素である。
次元およびメンバの関係
一実施形態によれば、多次元データベースは、ファミリ(親、子および兄弟、または子孫および祖先)および階層(世代およびレベル、またはルートおよびリーフ)などの用語を用いて、データベースアウトライン内のメンバの役割および関係を記述する。
一実施形態によれば、親は、下位に分岐を持つメンバである。例えば、「売上総利益」(Margin)は、「売上高」(Sales)および「売上原価」(COGS)の親であり得る。子は、上位に親を持つメンバである。上記の例では、「売上高」および「売上原価」は、親の「売上総利益」の子である。兄弟は、すぐ上に同一親を持つ同一世代の子メンバである。
一実施形態によれば、子孫は、親の下位の分岐に位置するメンバである。例えば、「利益」(Profit)、「在庫」(Inventory)および「利益率」(Ratios)は、メジャーの子孫であり得る。この場合、「利益」、「在庫」および「利益率」の子も、メジャーの子孫である。祖先は、メンバの上位の分岐に位置するメンバである。上記の例では、「売上総利益」、「利益」およびメジャーは、「売上高」の祖先であり得る。
一実施形態によれば、ルートは、分岐内の最上位のメンバである。例えば、メジャーは、「利益」、「在庫」および「利益率」のルートであり、「利益」、「在庫」および「利益率」の子のルートでもある。リーフ(レベル0)メンバは、子を持たない。例えば、「期首在庫」、「追加額」、および「期末在庫」は、リーフメンバであり得る。
一実施形態によれば、世代とは、1つの次元内の集約レベルを指す。木のルートは、「第1世代」と見なされる。世代の番号は、ルートからリーフメンバに向かって大きくなる。レベルは、次元内の分岐を表す。レベルは、世代に使用された順序と逆の順序で番号付けられる。レベルの番号は、リーフメンバからルートに向かって小さくなる。
一実施形態によれば、ユーザは、世代またはレベルに名前を指定し、その名前をその世代またはレベル内のメンバ全員の略語として使用することができる。
疎次元および密次元
多次元データベース内のデータセットは、通常、2つの特性、すなわち、データが円滑且つ均一に分布されていないという特性、およびデータがメンバの組み合わせの大半に存在していないという特性を共有している。
一実施形態によれば、このようなデータセットを処理するために、システムは、2種類の標準次元、すなわち、疎次元および密次元を認識することができる。疎次元は、使用可能なデータ位置が占有された割合が比較的低い次元である。密次元は、次元の全ての組み合わせにおいて1つ以上のセルが占有された確率が比較的高い次元である。多くの多次元データベースは、メンバの組み合わせの大半がデータ値を有しないため、本質的に疎である。
データブロックおよび索引体系
一実施形態によれば、多次元データベースは、データブロックおよび索引を用いて、データを格納し、アクセスする。システムは、疎次元の標準メンバの各特定の組み合わせに対して多次元配列またはデータブロックを作成することができる。各データブロックは、疎次元のメンバの組み合わせに対応する密次元のメンバを表す。各データブロックに索引を作成する。索引は、疎次元の標準メンバの組み合わせを表し、少なくとも1つのデータ値が存在する疎次元の標準メンバの各特定の組み合わせに対応するエントリまたはポインタを含む。
一実施形態によれば、多次元データベースサーバは、データ値を検索する時に、索引によって提供されたポインタを用いて、適切なデータブロックを特定し、そのデータブロック内でデータ値を含むセルを特定することができる。
管理サービス
一実施形態によれば、管理サービス(例えば、Essbase管理サービス)は、ユーザがサーバ、アプリケーションおよびデータベースを設計、開発、維持および管理することを可能にする単一のアクセスポイントを提供する。
スタジオ
一実施形態によれば、スタジオ(例えば、Essbaseスタジオ)は、データのモデル化、キューブの設計および分析アプリケーションの構築に関連するタスクを実行するためのウィザード駆動型ユーザインターフェイス(wizard-driven user interface)を提供する。
スプレッドシートアドイン
一実施形態によれば、スプレッドシートアドインは、多次元データベースをスプレッドシートと統合することによって、接続(Connect)、ピボット(Pivot)、ドリルダウン(Drill-down)および計算(Calculate)などの拡張命令をサポートする。
統合サービス
一実施形態によれば、統合サービス(例えば、Essbase統合サービス)は、多次元データベースに格納されたデータと関係データベースに格納されたデータとを統合する時に使用されるメタデータ駆動型環境を提供する。
プロバイダサービス
一実施形態によれば、プロバイダサービス(例えば、Hyperionプロバイダサービス)は、Java(登録商標)API、スマートビュー(Smart View)、およびXMLAクライアントのデータソースプロバイダとして動作する。
スマートビュー
一実施形態によれば、スマートビューは、例えば、Hyperion収益管理、Hyperion計画、およびHyperionエンタープライズパフォーマンス管理ワークスペースデータの共通インターフェイスを提供する。
開発製品
一実施形態によれば、開発製品は、カスタマイズされたエンタープライズ分析アプリケーションの迅速な作成、管理および配置を可能にする。
ライフサイクル管理
一実施形態によれば、ライフサイクル管理(例えば、Hyperionエンタープライズパフォーマンス管理システムのライフサイクル管理)は、エンタープライズパフォーマンス管理製品がアプリケーション、リポジトリまたは個々のアイテムを製品環境の全体に亘って移行することを可能にする手段を提供する。
OLAP
一実施形態によれば、オンライン分析処理(OLAP)は、ユーザによる企業データの分析を可能にする環境を提供する。例えば、財務部門は、OLAPを予算、活動に基づく原価の計算、財務実績分析および財務モデル化などに応用することによって、「ジャストインタイム」(just-in-time)情報を提供することができる。
キューブの自動推論
表形式データファイル(表形式データ)において、列は、一般に不均一に相関され、列(属性)間には多くの隠然依存性が存在する。手動で表形式データからキューブスキーマを抽出することは、手間および労力がかかる作業である。
一実施形態によれば、本明細書に記載のシステムおよび方法を用いて、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論することができる。システムは、キューブスキーマ推論要素を含むことができる。キューブスキーマ推論要素は、表形式データに対して列方向の分割を連続的に行うことによって、表形式データ内の複数列のうち、各対の列の情報利得比を計算することができる。各対の列の情報利得比から、相互相関マトリックスを構築することができる。システムは、相互相関マトリックスに基づいて、複数列の間の関係を決定し、その関係を表す階層性有向グラフ(hierarchy directed graph)を作成することができる。さらに、システムは、階層性有向グラフをキューブスキーマに変換し、表形式データをロードするために、変換したキューブスキーマを用いて多次元データベース環境内でキューブを作成することができる。
一実施形態によれば、システムは、表形式データから推論された階層性有向グラフを既存のキューブからの階層性有向グラフと比較することによって、2つの階層性有向グラフが一致するか否かを判定することができる。一致する場合に、既存のキューブに表形式データをロードすることができる。それ以外の場合に、新しいキューブを作成して、表形式データを格納することができる。
一実施形態によれば、表形式データは、異なるデータドメイン、例えば、医療データドメインおよび金融データドメインからのデータを含むことができる。システムは、データの値を解釈せず、列間のエントロピーおよび/または情報利得比で統計的相関を計算するため、列が異なるエンコードを使用しても、表形式データ内の列間の隠然関係を検出することができる。
一実施形態によれば、列間の統計的相関を計算する際に、システムは、各文字列パターンに関連する意味を分析または解釈する必要がなく、セル内の文字列パターンまたはセル内の値から変換された文字列パターンを検査することができる。
序文
一実施形態によれば、以下の用語が本明細書に使用される。
エントロピー
一実施形態によれば、XのエントロピーH(X)は、以下のように定義することができる。
Figure 0006846356
式中、Xは、例えば、データベーステーブルまたはExcelシートのような表形式データの列/属性である。エントロピーは、確率分布の関数として見なすことができ、属性の実際値から独立していてもよい。
条件付きエントロピー
一実施形態によれば、XおよびYの条件付きエントロピーは、以下のように定義することができる。
Figure 0006846356
式中、XおよびYは、例えば、データベーステーブルまたはExcelシートのような表形式データの列/属性である。属性Yの情報が与えられた場合、条件付きエントロピーH(X|Y)は、属性Xの不確定性を測ることができる。これは、非負の実数であり、X=YまたはYとXとの間に関数依存性が存在する時に、属性Xが不確定性を有しないため、0になる。一方、2つの属性XおよびYが独立している場合、条件付きエントロピーH(X|Y)は、H(X)に等しくなる。
情報利得
一実施形態によれば、XおよびYの情報利得は、エントロピーおよび条件付きエントロピーを用いて、以下のように定義することができる。
Figure 0006846356
式中、XおよびYは、例えば、データベーステーブルまたはExcelシートのような表形式データの列/属性である。情報利得は、確率分布の関数であり、属性の実際値とは無関係である。
情報利得比
一実施形態によれば、Xの情報利得比は、以下のように定義することができる。
Figure 0006846356
式中、XおよびYは、例えば、データベーステーブルまたはExcelシートのような表形式データの列/属性である。情報利得比は、他の属性の情報による1つの属性の不確実性の減少を測定する。情報利得比は、1つの属性に含まれた他の属性に関する情報の量を測る。2つの属性が独立している場合、情報利得比は、0になり、2つの属性間の依存性が大きくなることに連れて増加する。1つの属性とそれ自体との情報利得比は、1に等しい。
図2は、一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムを示す図である。
図2に示すように、キューブスキーマ推論要素207は、相互相関マトリックスコンポーザ211と、階層性有向グラフビルダ215と、階層性有向グラフパーサ217とを含むことができる。キューブスキーマ推論要素207を実行することによって、表形式データ記憶装置205から受信した表形式データから、キューブスキーマ219を推論することができる。表形式データは、列または表から構成されてもよく、列または表で表示されてもよい。表形式データは、Excelシート、プレーンテキストファイルまたは関係データベーステーブルに格納されたデータであってもよい。
本開示の一実施形態によれば、表形式データは、表形式データを格納する表形式データファイルを照会することができる。したがって、表形式データと表形式データファイルとは、交換可能に使用することができる。
一実施形態によれば、キューブスキーマ推論要素は、ユーザ201からの要求に応じて、ユーザインターフェイス203を介して表形式データを検索し、その表形式データをキューブスキーマ推論要素の入力として提供することができる。
一実施形態によれば、キューブスキーマ推論要素は、多次元データベースクライアント230の一部であってもよく、独立型アプリケーションとして実行してもよい。
一実施形態によれば、相互相関マトリックスコンポーザは、表形式データに対して列方向の分割を連続的に行うことによって、表形式データ内の複数列のうち、各対の列の情報利得比を計算し、各対の列の情報利得比を表す相互相関マトリックスを構築することができる。
一実施形態によれば、列方向の分割を連続的に行うことによって、システムは、各対の列に対して2つの情報利得比を計算することができる。例えば、1対の列Aおよび列Bに対して2つの情報利得比を計算することによって、一方の属性に含まれた他方の属性に関する情報の量を測ることができる。
一実施形態によれば、上述したように、情報利得比は、以下の式を用いて計算することができる。
Figure 0006846356
一実施形態によれば、相互相関マトリックスは、1対の列の間の関係属性(例えば、情報利得比)を格納するデータ構造(例えば、2次元配列)であってもよい。
一実施形態によれば、階層性有向グラフビルダは、相互相関マトリックスを検査することによって、各対の列の関係を判定し、相互相関マトリックスから階層性有向グラフを構築することによって、その関係を表すことができる。階層性有向グラフは、表形式データ内の全ての列/属性対の各対の情報利得比を含むように構成することができる。
一実施形態によれば、階層性有向グラフは、頂点(ノード)の有限集合と、有序エッジ対の有限集合とを含むデータ構造であってもよい。階層性有向グラフパーサは、階層性有向グラフを解析することができる。階層性有向グラフパーサは、階層性有向グラフをXML型キューブスキーマ219、例えばEssbaseデータベースアウトラインに変換することができる。このキューブスキーマ219を用いて、データベースサーバ上でキューブ221を作成することができる。
図3は、一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマの自動推論を示す図である。
図3に示すように、システムは、複数列を含む表形式データ313を列ごとに分割することによって、各対の列の情報利得比を計算することができる。
ステップ319において、列i315と列j317との情報利得比(すなわち、IGRijおよびIGRji)を計算することができる。情報利得比を用いて、1対の列の間の関係を判断することができる。
ステップ321において、XOR演算子を用いて、1対の列の間の関係を判断することができる。1対の列の情報利得比のうち一方且つ一方のみが1である場合、XOR演算子の値は、真である。
ステップ322において、XOR演算子の値が真である場合、システムは、1対の列の間に1対多関係が存在すると判断することができる。
ステップ323において、XOR演算の値が偽である場合、AND演算子を用いて、続けて1対の列の関係を検査することができる。AND演算子の値が真になるためには、両方の情報利得比が真になる必要がある。
ステップ327において、AND演算子の値が真である場合、システムは、1対の列の間に1対1関係が存在すると判定することができる。それ以外の場合に、この対の列の間に相関関係または依存性が存在せず、システムは、異なる対の列の間の関係を検査することができる。
ステップ329において、決定された各対の列の間の関係を用いて、階層性有向グラフを更新することができる。
一実施形態によれば、各対の列の間の関係で更新可能な階層性有向グラフのテンプレートとして、XMLファイルを作成することができる。
ステップ331において、階層性有向グラフをキューブスキーマに変換することができる。
図4は、一実施形態に従って、本発明のシステムを用いて、表形式データから、キューブスキーマを自動的に推論する例を示す図である。
図4に示すように、表形式データ411は、次元Aおよび次元C並びに数値属性Dを有するキューブを表すことができる4列のデータを含む。
表形式データにおいて、列Aのa1は、列Bのb2およびb3に対応し、列Aのa2は、列Bのb1およびb3に対応し、列Cの列c2は、列Dのd8およびd9に対応し、列Cのc1およびc4は、列Dのd7およびd10に各々対応する。
一実施形態によれば、各列の連続的な分割によって計算された情報利得比を用いて、情報利得比の相互相関マトリックス413を構築することができる。
例えば、列Aを分割する場合、計算された情報利得比は、列Aおよび列Bの情報利得比(1.00)、列Aおよび列Cの情報利得比(0.5)、列Aおよび列Dの情報利得比(1.00)を含むことができる。
同様に、列Bを分割する場合、計算された情報利得比は、列Bおよび列Aの情報利得比(0.50)、列Bおよび列Cの情報利得比(0.75)、列Bおよび列Dの情報利得比(1.00)を含むことができる。
上述したように、情報利得比は、1つの属性に含まれた他の属性に関する情報の量を測ることができる。この特定の例において、列Aに含まれた列Bに関する情報量は、列Bに含まれた列Aに関する情報量よりも多い。
列Aの観点から、列A内のセルの値がa1である場合、列B内の対応セルの値は、b2およびb4である。列A内のセルの値がa1ではない場合、列B内の対応セルの値は、b2またはb4にならない。
列Bの視点から、列B内のセルの値がb2である場合、列A内の対応セルの値は、a1である。しかしながら、列B内のセルの値がb2ではない場合、列A内の対応セルの一方の値は、a1のままである。
したがって、列Aおよび列Bの情報利得比は、1であるが、列Bおよび列Aの情報利得比は、0.5である。
一実施形態によれば、情報利得比の相互相関マトリックス413は、同一属性間の相互相関をさらに含むことができる。マトリックスの主対角線は、各列自身との相互情報に相当する値を含むことができる。この値は、上記のエントロピー公式を用いて計算することができる。
さらに図4に示すように、相互相関マトリックスから、階層性有向グラフ415を構築することができる。有向グラフは、複数のノードと、ノードAおよびノードCを除き、各対のノードの間のエッジとを含む。各ノードは、表形式データ411内の属性または列を表し、各エッジは、各対のノードの間の関係を表す。各エッジ上の標記は、2つの隣接ノードの間の情報利得比を示す。
例えば、ノードAとノードBとの間の情報利得比は、1.0であり、ノードBとノードAとの間の情報利得比は、0.50である。ノード上の標記は、各列自身との相互情報または各列自身の情報に相当する属性または列のエントロピーを表す。
この特定の例において、列Aと列Cとの間に相関または依存性が存在しないため、2つのノード間にエッジが存在しない。
一実施形態によれば、階層性有向グラフから、キューブスキーマ417を生成することができる。キューブスキーマは、データベースアウトラインを特定するXMLファイルであってもよい。このデータベースアウトラインを用いて、表形式データをロードする際に使用されるキューブを多次元データベース環境に作成することができ、または生成されたアウトラインとデータベースサーバ内の既存のアウトラインとの比較に基づいて、表形式データを既存のキューブにロードすることができるか否かを判断することができる。
キューブ要素の特定
一実施形態によれば、階層性有向グラフをキューブスキーマまたはデータベースアウトラインに変換する時に、システムは、階層性有向グラフ上の各列をキューブスキーマによって定義されたキューブの特定の要素(例えば、メジャー列、上位列、下位列、または属性列)にマッピングする必要がある。
一実施形態によれば、発見的プロセス(heuristic process)を用いて、キューブスキーマ/スタースキーマを構築する時に使用される階層性有向グラフ上の複数列から、キューブ要素を特定することができる。
発見的プロセスによって、高い確率で特定され得る1つ以上のキューブ要素、例えば、1つ以上のメジャー列および/または1つ以上のフラット次元列(フラット階層次元列)を最初に特定し、複数列から除去することができる。
残りの列から、より複雑なキューブ要素(例えば、次元階層内の列)を特定することができる。
一実施形態によれば、ある列が数値列または浮動小数点列であり且つ複数列のうち他の列と関係(すなわち、1対1関係、多対1関係、または1対多関係)を有しない場合、この列をメジャー列として特定することができる。
一実施形態によれば、システムは、無限キューブに対応するスタースキーマの構築をサポートすることができる。例えば、Excelシートにメジャー列が含まれていない場合、システムは、各行に任意の数値(例えば、数字「1」)を保持することができる仮想列をメジャー列として追加し、この列をメジャー列として使用することができる。この場合、Excelシート内の実際の列は、次元階層になり、仮想列は、メジャー列になる。
一実施形態によれば、ある列が複数列のうち他の列と関係を有しないテキスト列である場合またはある列が他の全ての列と1対1または多対1関係を有する数値列または文字列である場合、この列をフラット階層次元列として特定することができる。デフォルトでは、重複値を有しない数値列は、フラット階層次元列として特定することができる。
一実施形態によれば、残りの列は、複数の次元および1つ以上のメジャー列を含むことができる。各次元は、残り列の列集合を含むことができる。
一実施形態によれば、システムは、次元の次元階層を作成するために、次元に関連する列の集合から、下位列および1つ以上の上位列を特定することができる。
一実施形態によれば、下位列は、次元を構成する1群の列内の他の各列と多対1または1対1関係のみを有する列である。上位列は、次元を構成する1群の列内の他の各列と1対多または1対1関係のみを有する列である。次元列のセットでは、中間列は、1群の列内の下位列と1対多関係を有し且つ上位列と多対1関係を有する列である。
一実施形態によれば、次元階層は、下位列、上位列、および1つ以上の中間列を用いて作成されることができ、1つ以上のフラット階層次元列に追加されることができる。1つ以上のメジャー列、1つ以上のフラット階層次元列および次元階層を用いて、キューブスキーマを作成することができる。
一実施形態によれば、次元内の列の集合に対して複数の上位列が特定された場合、1つ以上の中間列および下位列と組み合わせて、最トップレベル/最長の組み合わせ/チェーンを作成することができる1つの上位列は、上位列として選択される。残りの上位列は、属性として特定されまたは代替の次元階層の上位列として特定されてもよい。
一実施形態によれば、下位列、選択された上位列および中間列を用いて構築された最トップレベルの階層は、主な次元階層として見なすことができる。主な次元階層に含まれていない次元列群内の列は、下位列の属性として特定することができる。
一実施形態によれば、上位列および中間列を除去した後、上記のプロセスを繰り返すことによって、代替の次元階層を特定することができる。特定の次元に対応する各代替の次元階層および(最初に特定された)主な次元階層は、同様の下位列を共有することができる。
図5A〜図5Bは、一実施形態に従って、表形式データの列を複数のキューブ要素にマッピングするためのフローチャートを示す図である。
図5A〜5Bに示すように、ステップ519において、キューブスキーマ推論要素は、階層性有向グラフ上に表示された複数列からの間の関係に基づいて、表形式データ内の複数列から、1つ以上のメジャー列および1つ以上のフラット次元列を特定することができる。
ステップ521において、特定されたメジャー列およびフラット次元列を複数列から除去することができる。
ステップ523において、キューブスキーマ推論要素は、複数列のうち残りの列から、1組以上の列を特定することができる。各組の列は、次元を定義し、組内の他の列と多対1関係または1対1関係を有する下位列を含む。
ステップ525において、キューブスキーマ推論要素は、各次元に対応する列の組から、1つ以上の上位列を特定することができる。各上位列は、群内の他の列と1対多関係または1対1関係を有する。
ステップ527において、キューブスキーマ推論要素は、特定された1つ以上の上位列から、各次元の最高階層の構築に使用できる列を選択することができる。
ステップ529において、キューブスキーマ推論要素は、各次元階層の1つ以上の中間列を特定することができる。各中間列は、選択された上位列と多対1関係を有し、下位列と多対多関係を有する。
ステップ531において、キューブスキーマ推論要素は、特定された下位列、選択された上位列および特定された中間列を用いて、各次元の次元階層を作成することができる。
ステップ533において、キューブスキーマ推論要素は、1組以上の列の各々から、対応の次元階層に含まれていない1つ以上の列を決定し、これらの列を対応の次元階層内の下位列の属性列としてマークする。下位列の属性列としてマークされた1つ以上の列は、下位列または選択された上位列および上記に上位列として特定されたが選択されていない上位列との間に1対1関係を有する任意の列を含むことができる。
ステップ535において、キューブスキーマ推論要素は、1つ以上のメジャー列、1つ以上のフラット次元列、1つ以上の次元階層および1つ以上の次元階層の各々の下位列の1つ以上の属性列を用いて、キューブスキーマを作成することができる。
図6は、一実施形態に従って、表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するための方法を示す図である。
図6に示すように、ステップ613において、1つ以上のマイクロプロセッサ上で動作するキューブスキーマ推論要素を提供する。キューブスキーマ推論要素は、多次元データベースサーバのクライアントとして動作する。
ステップ615において、キューブスキーマ推論要素を用いて、キューブスキーマ推論要素に受信された表形式データ内の複数列のうち、各対の列の情報利得比を計算する。
ステップ617において、各対の列の情報利得比を用いて、各対の列の関係を決定する。
ステップ619において、決定された関係を用いて、階層性有向グラフを構築する。
ステップ621において、階層性有向グラフは、多次元データベースサーバ内にキューブを作成する際に使用されるキューブスキーマに変換される。
図7は、一実施形態に従って、本発明のシステムを使用することができる環境を示すアーキテクチャ図である。
図7に示すように、キューブスキーマ推論要素713は、多次元データベースサーバ717のクライアントA711上で動作し、表形式データ記憶装置A705に格納された表形式データからキューブスキーマを抽出し、多次元データベースサーバ内のキューブスキーマを用いて作成されたキューブに、クライアントB715に利用される表形式データをロードすることができる。
一実施形態によれば、多次元データベースサーバは、表形式データ記憶装置B707と通信することができる。これによって、表形式データ記憶装置B707は、表形式データおよびデータベースファイルを提供して、多次元データベースサーバをサポートすることができる。
例えば、表形式データおよびデータベースファイルは、ログファイルおよびEssbaseスタジオのメタデータを含むことができる。
本発明は、本開示の教示に従ってプログラムされた1つ以上のプロセッサ、メモリおよび/またはコンピュータ可読記憶媒体を含む1つ以上の従来の汎用または専用コンピュータ、コンピューティング装置、機械、またはマイクロプロセッサを使用して都合よく実施することができる。ソフトウェア分野の当業者には明らかであるように、熟練したプログラマは、本開示の教示に基づいて、適切なソフトウェアのコーディングを容易に準備することができる。
いくつかの実施形態において、本発明は、命令を格納した非一時的記憶媒体またはコンピュータ可読媒体であるコンピュータプログラム製品を含み、これらの命令を用いてコンピュータをプログラムすることによって、本発明の任意の処理を実行することができる。記憶媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、および光磁気ディスクを含む、任意の種類のディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気もしくは光カード、ナノシステム(分子メモリICを含む)、または、命令および/もしくはデータを格納するのに適した任意の種類の媒体もしくは装置を含むことができるが、これらに限定されない。
本発明の上記記載は、例示および説明を目的として提供される。本発明を網羅的なものまたは開示された形態そのものに限定することを意図していない。本発明の広さおよび範囲は、上記の例示的な実施形態のいずれかによって限定されるべきではない。数多くの変更および変形は、当業者にとって明らかであろう。修正例および変形例は、開示された特徴の任意可能な組み合わせを含む。実施形態は、本発明の原理およびその実際の応用を最も良く説明することによって、他の当業者がさまざまな実施形態および考えられる特定の用途に適したさまざまな変形に応じて本発明を理解できるように、選択され説明される。本発明の範囲は、添付の特許請求の範囲およびそれらの同等物によって規定されると意図する。

Claims (19)

  1. 表形式データから、多次元データベース環境に使用されるキューブスキーマ推論するためのシステムであって、
    1つ以上のマイクロプロセッサを含むコンピュータと、
    前記コンピュータ上で動作する多次元データベースサーバと、
    前記多次元データベースサーバのクライアントとして動作するキューブスキーマ推論要素とを備え、
    前記キューブスキーマ推論要素は、
    前記キューブスキーマ推論要素に受信された表形式データ内の複数列のうち、各対の列の情報利得比を計算し、
    各対の列の前記情報利得比を用いて、各対の列の関係を決定し、
    決定された関係を用いて、階層性有向グラフを構築し、
    前記階層性有向グラフを、多次元データベースサーバ内でキューブを作成する際に使用されるキューブスキーマに変換する、システム。
  2. 前記キューブスキーマ推論要素は、各対の列の前記情報利得比を格納するマトリックスを構築するようにさらに構成されている、請求項1に記載のシステム。
  3. 前記階層性有向グラフの各エッジは、2つの隣接ノードの間の情報利得比で標記され、
    前記階層性有向グラフの各ノードは、そのノードによって表される列のエントロピーで標記される、請求項1または2に記載のシステム。
  4. 前記階層性有向グラフは、階層性有向グラフパーサによって解析され、XML型キューブスキーマに変換される、請求項1〜3のいずれか1項に記載のシステム。
  5. 前記XML型キューブスキーマは、前記多次元データベースサーバ内のデータベースアウトラインである、請求項4に記載のシステム。
  6. 各対の列の第1列と第2列との間の各情報利得比は、前記第1列に含まれた前記第2列に関する情報の量を測る、請求項1〜5のいずれか1項に記載のシステム。
  7. 前記キューブスキーマ推論要素は、各列の値を解釈せず、各対の列の前記情報利得比を計算する、請求項1〜6のいずれか1項に記載のシステム。
  8. 前記表形式データは、Excelシート、テキストファイルまたはデータベーステーブルに格納されたデータである、請求項1〜7のいずれか1項に記載のシステム。
  9. 前記キューブスキーマ推論要素は、前記階層性有向グラフを解析し、発見的プロセスを実行することによって、前記キューブスキーマを構築する際に使用される複数のキューブ要素を特定するように構成され、
    前記発見的プロセスは、
    前記階層性有向グラフ上に表示された複数列から、1つ以上のメジャー列および1つ以上のフラット階層次元列を特定するステップと、
    特定された前記1つ以上のメジャー列および前記1つ以上のフラット階層次元列を前記複数列から除去するステップと、
    残りの列から、1つ以上の次元階層を特定するステップと、
    前記1つ以上のメジャー列、前記1つ以上のフラット階層次元列および前記1つ以上の次元階層を用いて、キューブスキーマを作成する、請求項1〜8のいずれか1項に記載のシステム。
  10. 表形式データから、多次元データベース環境に使用されるキューブスキーマ推論するための方法であって、
    1つ以上のマイクロプロセッサキューブスキーマ推論要素のプロセス実行するステップを備え、前記キューブスキーマ推論要素は、前記プロセスが実行されると前記多次元データベース環境内の多次元データベースサーバのクライアントとして動作し、
    前記キューブスキーマ推論要素のプロセスは、
    前記キューブスキーマ推論要素に受信された表形式データ内の複数列のうち、各対の列の情報利得比を計算するステップと、
    各対の列の前記情報利得比を用いて、各対の列の関係を決定するステップと、
    前記決定された関係を用いて、階層性有向グラフを構築するステップと、
    前記階層性有向グラフを、前記多次元データベースサーバ内でキューブを作成する際に使用されるキューブスキーマに変換するステップとを備える、方法。
  11. 前記キューブスキーマ推論要素のプロセスは、各対の列の前記情報利得比を格納するマトリックスを構築するステップをさらに備える、請求項10に記載の方法。
  12. 前記階層性有向グラフの各エッジは、2つの隣接ノードの間の情報利得比で標記され、
    前記階層性有向グラフの各ノードは、そのノードによって表される列のエントロピーで標記される、請求項10または11に記載の方法。
  13. 前記キューブスキーマはXML型キューブスキーマを含み、
    前記変換するステップでは、
    前記階層性有向グラフは、階層性有向グラフパーサによって解析され、XML型キューブスキーマに変換される、請求項10〜12のいずれか1項に記載の方法。
  14. 前記XML型キューブスキーマは、前記多次元データベースサーバ内のデータベースアウトラインである、請求項13に記載の方法。
  15. 各対の列の第1列と第2列との間の各情報利得比は、前記第1列に含まれた前記第2列に関する情報の量を測る、請求項10〜14のいずれか1項に記載の方法。
  16. 前記計算するステップは、
    列の値を解釈せず、各対の列の前記情報利得比を計算するステップを含む、請求項10〜15のいずれか1項に記載の方法。
  17. 前記表形式データは、Excelシート、テキストファイルまたはデータベーステーブルに格納されたデータである、請求項10〜16のいずれか1項に記載の方法。
  18. 前記変換するステップは、
    前記階層性有向グラフを解析し、発見的プロセスを実行することによって、前記キューブスキーマを構築する際に使用される複数のキューブ要素を特定するステップを含み
    前記発見的プロセスは、
    前記階層性有向グラフ上に表示された複数列から、1つ以上のメジャー列および1つ以上のフラット階層次元列を特定するステップと、
    特定された前記1つ以上のメジャー列および前記1つ以上のフラット階層次元列を前記複数列から除去するステップと、
    残りの列から、1つ以上の次元階層を特定するステップと、を含み、
    前記変換するステップは、
    前記1つ以上のメジャー列、前記1つ以上のフラット階層次元列および前記1つ以上の次元階層を用いて、キューブスキーマを作成するステップを含む、請求項10〜17のいずれか1項に記載の方法。
  19. 機械可読プログラム命令を含むコンピュータプログラムであって、これらの命令は、コンピュータによって実行されると、前記コンピュータに請求項10〜18のいずれか1項に記載の方法を実行させる、コンピュータプログラム。
JP2017558695A 2015-10-23 2016-10-21 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法 Active JP6846356B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562245885P 2015-10-23 2015-10-23
US62/245,885 2015-10-23
PCT/US2016/058209 WO2017070533A1 (en) 2015-10-23 2016-10-21 System and method for automatic inference of a cube schema from a tabular data for use in a multidimensional database environment

Publications (3)

Publication Number Publication Date
JP2018536909A JP2018536909A (ja) 2018-12-13
JP2018536909A5 JP2018536909A5 (ja) 2019-11-07
JP6846356B2 true JP6846356B2 (ja) 2021-03-24

Family

ID=57219058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017558695A Active JP6846356B2 (ja) 2015-10-23 2016-10-21 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法

Country Status (5)

Country Link
US (2) US10846273B2 (ja)
EP (1) EP3365810B1 (ja)
JP (1) JP6846356B2 (ja)
CN (1) CN107533570B (ja)
WO (1) WO2017070533A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10909178B2 (en) * 2015-03-05 2021-02-02 Workday, Inc. Methods and systems for multidimensional analysis of interconnected data sets stored in a graph database
US10733155B2 (en) 2015-10-23 2020-08-04 Oracle International Corporation System and method for extracting a star schema from tabular data for use in a multidimensional database environment
US10977435B2 (en) * 2015-12-28 2021-04-13 Informatica Llc Method, apparatus, and computer-readable medium for visualizing relationships between pairs of columns
US10747736B2 (en) * 2016-11-09 2020-08-18 Sap Se Aggregation database for external dataset
US10650050B2 (en) * 2016-12-06 2020-05-12 Microsoft Technology Licensing, Llc Synthesizing mapping relationships using table corpus
US10061637B1 (en) * 2017-01-19 2018-08-28 Amdocs Development Limited System, method, and computer program for automatic root cause analysis
KR101758219B1 (ko) * 2017-01-24 2017-07-14 김훈 수치정보 검색이 가능한 수치정보 관리장치
CN110019440B (zh) * 2017-08-30 2021-06-08 北京国双科技有限公司 数据的处理方法及装置
CN107678531B (zh) * 2017-09-30 2020-12-01 Oppo广东移动通信有限公司 应用清理方法、装置、存储介质及电子设备
US10509805B2 (en) * 2018-03-13 2019-12-17 deFacto Global, Inc. Systems, methods, and devices for generation of analytical data reports using dynamically generated queries of a structured tabular cube
CN110727840B (zh) * 2019-09-27 2022-07-05 浙江大搜车软件技术有限公司 车辆问询标签推送方法、装置、计算机设备和存储介质
CN110728124B (zh) * 2019-10-15 2021-01-08 深圳逻辑汇科技有限公司 用于可视化电子表格的方法、装置、设备及存储介质
CN111143412A (zh) * 2019-12-24 2020-05-12 中科金审(北京)科技有限公司 数据对比方法、装置、计算机及计算机可读存储介质
EP4264412A1 (en) 2021-01-26 2023-10-25 Donyati, LLC Dynamic application builder for multidimensional database environments

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775675B1 (en) * 2001-04-04 2004-08-10 Sagemetrics Corporation Methods for abstracting data from various data structures and managing the presentation of the data
US7146375B2 (en) 2002-01-25 2006-12-05 Decode Genetics, Ehf Inference control method in a data cube
US7593955B2 (en) * 2004-11-30 2009-09-22 International Business Machines Corporation Generation of aggregatable dimension information within a multidimensional enterprise software system
US7505888B2 (en) * 2004-11-30 2009-03-17 International Business Machines Corporation Reporting model generation within a multidimensional enterprise software system
EP1894151A2 (en) * 2005-06-20 2008-03-05 Future Route Limited Analytical system for discovery and generation of rules to predict and detect anomalies in data and financial fraud
CA2551030A1 (en) * 2005-06-24 2006-12-24 Orbital Technologies Inc. System and method for translating between relational database queries and multidimensional database queries
EP2041676A4 (en) 2006-06-26 2012-05-16 Nielsen Co Us Llc METHOD AND DEVICES FOR IMPROVING THE DATA WAREHOUSE EFFICIENCY
US20080027966A1 (en) * 2006-07-25 2008-01-31 Parees Benjamin M Dynamic creation of star-schema database structures and cubes
US8380748B2 (en) * 2008-03-05 2013-02-19 Microsoft Corporation Multidimensional data cubes with high-cardinality attributes
US9652516B1 (en) * 2008-03-07 2017-05-16 Birst, Inc. Constructing reports using metric-attribute combinations
WO2010091456A1 (en) * 2009-02-10 2010-08-19 Tap Holdings Pty Ltd Creation of a data store
US8195643B2 (en) * 2010-10-28 2012-06-05 Sap Ag Database calculation engine
US10360527B2 (en) * 2010-11-10 2019-07-23 International Business Machines Corporation Casual modeling of multi-dimensional hierarchical metric cubes
US8874595B2 (en) * 2011-11-15 2014-10-28 Pvelocity Inc. Method and system for providing business intelligence data
US20130332221A1 (en) 2012-06-12 2013-12-12 Siemens Aktiengesellschaft Method And System For Determining Critical Information Interfaces
JP5784239B2 (ja) * 2012-09-14 2015-09-24 株式会社日立製作所 データ分析方法、データ分析装置及びその処理プログラムを格納した記憶媒体
CN103793422B (zh) * 2012-10-31 2017-05-17 国际商业机器公司 基于增强星型模型的立方体元数据及查询语句生成
US9760571B1 (en) * 2013-07-23 2017-09-12 jSonar Inc. Tabular DB interface for unstructured data
US9898501B2 (en) * 2013-09-12 2018-02-20 Neustar, Inc. Method and system for performing transactional updates in a key-value store
US10353923B2 (en) * 2014-04-24 2019-07-16 Ebay Inc. Hadoop OLAP engine
US10698924B2 (en) * 2014-05-22 2020-06-30 International Business Machines Corporation Generating partitioned hierarchical groups based on data sets for business intelligence data models
US10025837B2 (en) * 2015-06-25 2018-07-17 Dundas Data Visualization, Inc. Systems and methods for intelligent data preparation and visualization
US10733155B2 (en) * 2015-10-23 2020-08-04 Oracle International Corporation System and method for extracting a star schema from tabular data for use in a multidimensional database environment

Also Published As

Publication number Publication date
US20210073188A1 (en) 2021-03-11
CN107533570A (zh) 2018-01-02
EP3365810A1 (en) 2018-08-29
US20170116228A1 (en) 2017-04-27
EP3365810B1 (en) 2021-08-18
US10846273B2 (en) 2020-11-24
WO2017070533A1 (en) 2017-04-27
JP2018536909A (ja) 2018-12-13
CN107533570B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
JP6846356B2 (ja) 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法
JP6827127B2 (ja) 多次元データベース環境において1回のスキャンでロード、集約、およびバッチ計算を行なうためのシステムおよび方法
US11914620B2 (en) System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment
US11741059B2 (en) System and method for extracting a star schema from tabular data for use in a multidimensional database environment
US20210286787A1 (en) System and method for slowly changing dimension and metadata versioning in a multidimensional database environment
US9460402B2 (en) Condensing hierarchical data
US20190102447A1 (en) System and method for metadata sandboxing and what-if analysis in a multidimensional database environment
KR102371811B1 (ko) 키드 엔티티들의 속성 매핑
US9477786B2 (en) System for metadata management
JP6832292B2 (ja) 多次元データベース環境にサンドボックスサポートを提供するためのシステムおよび方法
CN111542813A (zh) 使用异构数据的对象模型来便于建立数据可视化
JP7465870B2 (ja) 多次元データベース環境における依存関係分析のためのシステムおよび方法
US9582566B2 (en) Condensing hierarchical data
Bishnoi Implementation of Essbase Application using Oracle Hyperion

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190926

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210301

R150 Certificate of patent or registration of utility model

Ref document number: 6846356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250