JP2018536909A5 - - Google Patents

Download PDF

Info

Publication number
JP2018536909A5
JP2018536909A5 JP2017558695A JP2017558695A JP2018536909A5 JP 2018536909 A5 JP2018536909 A5 JP 2018536909A5 JP 2017558695 A JP2017558695 A JP 2017558695A JP 2017558695 A JP2017558695 A JP 2017558695A JP 2018536909 A5 JP2018536909 A5 JP 2018536909A5
Authority
JP
Japan
Prior art keywords
columns
cube
directed graph
cube schema
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017558695A
Other languages
English (en)
Other versions
JP6846356B2 (ja
JP2018536909A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2016/058209 external-priority patent/WO2017070533A1/en
Publication of JP2018536909A publication Critical patent/JP2018536909A/ja
Publication of JP2018536909A5 publication Critical patent/JP2018536909A5/ja
Application granted granted Critical
Publication of JP6846356B2 publication Critical patent/JP6846356B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (19)

  1. 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムであって、
    1つ以上のマイクロプロセッサを含むコンピュータと、
    前記コンピュータ上で動作する多次元データベースサーバと、
    前記多次元データベースサーバのクライアントとして動作するキューブスキーマ推論要素とを備え、
    前記キューブスキーマ推論要素は、
    前記キューブスキーマ推論要素に受信された表形式データ内の複数列のうち、各対の列の情報利得比を計算し、
    各対の列の前記情報利得比を用いて、各対の列の関係を決定し、
    決定された関係を用いて、階層性有向グラフを構築し、
    前記階層性有向グラフを、多次元データベースサーバ内でキューブを作成する際に使用されるキューブスキーマに変換する、システム。
  2. 前記キューブスキーマ推論要素は、各対の列の前記情報利得比を格納するマトリックスを構築するようにさらに構成されている、請求項1に記載のシステム。
  3. 前記階層性有向グラフの各エッジは、2つの隣接ノードの間の情報利得比で標記され、
    前記階層性有向グラフの各ノードは、そのノードによって表される列のエントロピーで標記される、請求項1または2に記載のシステム。
  4. 前記階層性有向グラフは、階層性有向グラフパーサによって解析され、XML型キューブスキーマに変換される、請求項1〜3のいずれか1項に記載のシステム。
  5. 前記XML型キューブスキーマは、前記多次元データベースサーバ内のデータベースアウトラインである、請求項4に記載のシステム。
  6. 各対の列の第1列と第2列との間の各情報利得比は、前記第1列に含まれた前記第2列に関する情報の量を測る、請求項1〜5のいずれか1項に記載のシステム。
  7. 前記キューブスキーマ推論要素は、各列の値を解釈せず、各対の列の前記情報利得比を計算する、請求項1〜6のいずれか1項に記載のシステム。
  8. 前記表形式データは、Excelシート、テキストファイルまたはデータベーステーブルに
    格納されたデータである、請求項1〜7のいずれか1項に記載のシステム。
  9. 前記キューブスキーマ推論要素は、前記階層性有向グラフを解析し、発見的プロセスを実行することによって、前記キューブスキーマを構築する際に使用される複数のキューブ要素を特定するように構成され、
    前記発見的プロセスは、
    前記階層性有向グラフ上に表示された複数列から、1つ以上のメジャー列および1つ以上のフラット階層次元列を特定するステップと、
    特定された前記1つ以上のメジャー列および前記1つ以上のフラット階層次元列を前記複数列から除去するステップと、
    残りの列から、1つ以上の次元階層を特定するステップと、
    前記1つ以上のメジャー列、前記1つ以上のフラット階層次元列および前記1つ以上の次元階層を用いて、キューブスキーマを作成する、請求項1〜8のいずれか1項に記載のシステム。
  10. 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するための方法であって、
    1つ以上のマイクロプロセッサ上で動作するキューブスキーマ推論要素を提供するステップを備え、前記キューブスキーマ推論要素は、前記多次元データベース環境内の多次元データベースサーバのクライアントとして動作し、
    前記キューブスキーマ推論要素を用いて、前記キューブスキーマ推論要素に受信された表形式データ内の複数列のうち、各対の列の情報利得比を計算するステップと、
    各対の列の前記情報利得比を用いて、各対の列の関係を決定するステップと、
    前記決定された関係を用いて、階層性有向グラフを構築するステップと、
    前記階層性有向グラフを、前記多次元データベースサーバ内でキューブを作成する際に使用されるキューブスキーマに変換するステップとを備える、方法。
  11. 前記キューブスキーマ推論要素は、各対の列の前記情報利得比を格納するマトリックスを構築するようにさらに構成されている、請求項10に記載の方法。
  12. 前記階層性有向グラフの各エッジは、2つの隣接ノードの間の情報利得比で標記され、
    前記階層性有向グラフの各ノードは、そのノードによって表される列のエントロピーで標記される、請求項10または11に記載の方法。
  13. 前記階層性有向グラフは、階層性有向グラフパーサによって解析され、XML型キューブスキーマに変換される、請求項10〜12のいずれか1項に記載の方法。
  14. 前記XML型キューブスキーマは、前記多次元データベースサーバ内のデータベースアウトラインである、請求項13に記載の方法。
  15. 各対の列の第1列と第2列との間の各情報利得比は、前記第1列に含まれた前記第2列に関する情報の量を測る、請求項10〜14のいずれか1項に記載の方法。
  16. 前記キューブスキーマ推論要素は、各列の値を解釈せず、各対の列の前記情報利得比を計算する、請求項10〜15のいずれか1項に記載の方法。
  17. 前記表形式データは、Excelシート、テキストファイルまたはデータベーステーブルに
    格納されたデータである、請求項10〜16のいずれか1項に記載の方法。
  18. 前記キューブスキーマ推論要素は、前記階層性有向グラフを解析し、発見的プロセスを実行することによって、前記キューブスキーマを構築する際に使用される複数のキューブ要素を特定するように構成され、
    前記発見的プロセスは、
    前記階層性有向グラフ上に表示された複数列から、1つ以上のメジャー列および1つ以上のフラット階層次元列を特定するステップと、
    特定された前記1つ以上のメジャー列および前記1つ以上のフラット階層次元列を前記複数列から除去するステップと、
    残りの列から、1つ以上の次元階層を特定するステップと、
    前記1つ以上のメジャー列、前記1つ以上のフラット階層次元列および前記1つ以上の次元階層を用いて、キューブスキーマを作成する、請求項10〜17のいずれか1項に記載の方法。
  19. 機械可読プログラム命令を含むコンピュータプログラムであって、これらの命令は、コンピュータよって実行されると、前記コンピューに請求項10〜18のいずれか1項に記載の方法を実行させる、コンピュータプログラム。
JP2017558695A 2015-10-23 2016-10-21 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法 Active JP6846356B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562245885P 2015-10-23 2015-10-23
US62/245,885 2015-10-23
PCT/US2016/058209 WO2017070533A1 (en) 2015-10-23 2016-10-21 System and method for automatic inference of a cube schema from a tabular data for use in a multidimensional database environment

Publications (3)

Publication Number Publication Date
JP2018536909A JP2018536909A (ja) 2018-12-13
JP2018536909A5 true JP2018536909A5 (ja) 2019-11-07
JP6846356B2 JP6846356B2 (ja) 2021-03-24

Family

ID=57219058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017558695A Active JP6846356B2 (ja) 2015-10-23 2016-10-21 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法

Country Status (5)

Country Link
US (2) US10846273B2 (ja)
EP (1) EP3365810B1 (ja)
JP (1) JP6846356B2 (ja)
CN (1) CN107533570B (ja)
WO (1) WO2017070533A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10909178B2 (en) 2015-03-05 2021-02-02 Workday, Inc. Methods and systems for multidimensional analysis of interconnected data sets stored in a graph database
US10733155B2 (en) 2015-10-23 2020-08-04 Oracle International Corporation System and method for extracting a star schema from tabular data for use in a multidimensional database environment
US10977435B2 (en) * 2015-12-28 2021-04-13 Informatica Llc Method, apparatus, and computer-readable medium for visualizing relationships between pairs of columns
US10747736B2 (en) * 2016-11-09 2020-08-18 Sap Se Aggregation database for external dataset
US10650050B2 (en) * 2016-12-06 2020-05-12 Microsoft Technology Licensing, Llc Synthesizing mapping relationships using table corpus
US10061637B1 (en) * 2017-01-19 2018-08-28 Amdocs Development Limited System, method, and computer program for automatic root cause analysis
KR101758219B1 (ko) * 2017-01-24 2017-07-14 김훈 수치정보 검색이 가능한 수치정보 관리장치
CN110019440B (zh) * 2017-08-30 2021-06-08 北京国双科技有限公司 数据的处理方法及装置
CN107678531B (zh) * 2017-09-30 2020-12-01 Oppo广东移动通信有限公司 应用清理方法、装置、存储介质及电子设备
US10509805B2 (en) 2018-03-13 2019-12-17 deFacto Global, Inc. Systems, methods, and devices for generation of analytical data reports using dynamically generated queries of a structured tabular cube
CN110727840B (zh) * 2019-09-27 2022-07-05 浙江大搜车软件技术有限公司 车辆问询标签推送方法、装置、计算机设备和存储介质
CN110728124B (zh) * 2019-10-15 2021-01-08 深圳逻辑汇科技有限公司 用于可视化电子表格的方法、装置、设备及存储介质
CN111143412A (zh) * 2019-12-24 2020-05-12 中科金审(北京)科技有限公司 数据对比方法、装置、计算机及计算机可读存储介质
AU2022214554B2 (en) 2021-01-26 2023-12-21 Donyati, Llc Dynamic application builder for multidimensional database environments

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574952A (en) 1994-05-11 1996-11-12 International Business Machines Corporation Data storage system and method for operating a disk controller including allocating disk space for compressed data
US5915129A (en) 1994-06-27 1999-06-22 Microsoft Corporation Method and system for storing uncompressed data in a memory cache that is destined for a compressed file system
DE69529088T2 (de) 1994-11-21 2003-09-25 Oracle Corp., Redwood City Verfahren und gerät für eine mehrdimensionale datenbank mit einem binären hyperräumlichen code
US6574720B1 (en) 1997-05-30 2003-06-03 Oracle International Corporation System for maintaining a buffer pool
US9208213B2 (en) 1999-05-28 2015-12-08 Microstrategy, Incorporated System and method for network user interface OLAP report formatting
US6766325B1 (en) 1999-12-02 2004-07-20 Microsoft Corporation System and method for maintaining data for performing “what if” analysis
US20020029207A1 (en) 2000-02-28 2002-03-07 Hyperroll, Inc. Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein
US6629102B1 (en) 2000-07-28 2003-09-30 International Business Machines Corporation Efficiently updating a key table during outline restructure of a multi-dimensional database
US6775675B1 (en) * 2001-04-04 2004-08-10 Sagemetrics Corporation Methods for abstracting data from various data structures and managing the presentation of the data
US7133876B2 (en) 2001-06-12 2006-11-07 The University Of Maryland College Park Dwarf cube architecture for reducing storage sizes of multidimensional data
US6880154B2 (en) 2001-06-29 2005-04-12 Intel Corporation Alias-free test for dynamic array structures
US6873994B2 (en) 2001-08-31 2005-03-29 I2 Technologies Us, Inc. Conflict detection and resolution in association with data allocation
US7146375B2 (en) 2002-01-25 2006-12-05 Decode Genetics, Ehf Inference control method in a data cube
US8386296B2 (en) 2002-03-08 2013-02-26 Agile Software Corporation System and method for managing and monitoring supply costs
US7366730B2 (en) * 2002-04-26 2008-04-29 Oracle International Corporation Registration of solved cubes within a relational database management system
US7058783B2 (en) 2002-09-18 2006-06-06 Oracle International Corporation Method and mechanism for on-line data compression and in-place updates
US7181450B2 (en) 2002-12-18 2007-02-20 International Business Machines Corporation Method, system, and program for use of metadata to create multidimensional cubes in a relational database
US20040193633A1 (en) * 2003-03-28 2004-09-30 Cristian Petculescu Systems, methods, and apparatus for automated dimensional model definitions and builds utilizing simplified analysis heuristics
US7089266B2 (en) 2003-06-02 2006-08-08 The Board Of Trustees Of The Leland Stanford Jr. University Computer systems and methods for the query and visualization of multidimensional databases
US7392242B1 (en) 2004-02-27 2008-06-24 Hyperion Solutions Corporation Query costing in a multidimensional database
US7647356B2 (en) 2004-05-07 2010-01-12 Oracle International Corporation Methods and apparatus for facilitating analysis of large data sets
US7562086B2 (en) 2004-07-09 2009-07-14 Microsoft Corporation Custom grouping for dimension members
US20060106769A1 (en) 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US7505888B2 (en) 2004-11-30 2009-03-17 International Business Machines Corporation Reporting model generation within a multidimensional enterprise software system
US7593955B2 (en) * 2004-11-30 2009-09-22 International Business Machines Corporation Generation of aggregatable dimension information within a multidimensional enterprise software system
US8510329B2 (en) 2005-05-25 2013-08-13 Experian Marketing Solutions, Inc. Distributed and interactive database architecture for parallel and asynchronous data processing of complex data and for real-time query processing
CA2604136A1 (en) * 2005-06-20 2006-12-28 Future Route Limited Analytical system for discovery and generation of rules to predict and detect anomalies in data and financial fraud
JP2008544382A (ja) * 2005-06-24 2008-12-04 オービタル・テクノロジーズ・インコーポレーテッド 関係データベースクエリと多次元データベースクエリとを変換するシステムおよび方法
US7792847B2 (en) 2005-09-09 2010-09-07 Microsoft Corporation Converting structured reports to formulas
US7805433B2 (en) 2005-10-14 2010-09-28 Microsoft Corporation Multidimensional cube functions
US20070094668A1 (en) 2005-10-17 2007-04-26 Jacquot Bryan J Method and apparatus for dynamically allocating resources used by software
US8156083B2 (en) 2005-12-01 2012-04-10 Oracle International Corporation Database system that provides for history-enabled tables
CN102929901B (zh) 2006-06-26 2016-12-14 尼尔森(美国)有限公司 提高数据仓库性能的方法和装置
US20080027966A1 (en) * 2006-07-25 2008-01-31 Parees Benjamin M Dynamic creation of star-schema database structures and cubes
US8108399B2 (en) 2007-05-18 2012-01-31 Microsoft Corporation Filtering of multi attribute data via on-demand indexing
US8234298B2 (en) 2007-07-25 2012-07-31 International Business Machines Corporation System and method for determining driving factor in a data cube
US8380748B2 (en) * 2008-03-05 2013-02-19 Microsoft Corporation Multidimensional data cubes with high-cardinality attributes
US9483537B1 (en) * 2008-03-07 2016-11-01 Birst, Inc. Automatic data warehouse generation using automatically generated schema
US8005818B2 (en) 2008-03-31 2011-08-23 Business Objects, S.A. Apparatus and method for maintaining metadata version awareness during set evaluation for OLAP hierarchies
US8606803B2 (en) 2008-04-01 2013-12-10 Microsoft Corporation Translating a relational query to a multidimensional query
US8169481B2 (en) 2008-05-05 2012-05-01 Panasonic Corporation System architecture and process for assessing multi-perspective multi-context abnormal behavior
US7970728B2 (en) 2008-10-23 2011-06-28 International Business Machines Corporation Dynamically building and populating data marts with data stored in repositories
CA2751383A1 (en) * 2009-02-10 2010-08-19 Zap Holdings Limited Creation of a data store
US8195643B2 (en) * 2010-10-28 2012-06-05 Sap Ag Database calculation engine
US10360527B2 (en) * 2010-11-10 2019-07-23 International Business Machines Corporation Casual modeling of multi-dimensional hierarchical metric cubes
US10102235B2 (en) * 2011-11-15 2018-10-16 Pvelocity Inc. Method and system for providing business intelligence data
US20130332221A1 (en) 2012-06-12 2013-12-12 Siemens Aktiengesellschaft Method And System For Determining Critical Information Interfaces
US9020991B2 (en) 2012-08-10 2015-04-28 Ca, Inc. System and method for analyzing available space in data blocks
US9892187B2 (en) * 2012-09-14 2018-02-13 Hitachi, Ltd. Data analysis method, data analysis device, and storage medium storing processing program for same
US20140122413A1 (en) 2012-10-29 2014-05-01 Paris Technologies, Inc. Bulk read and write between multi-dimensional data structures
CN103793422B (zh) * 2012-10-31 2017-05-17 国际商业机器公司 基于增强星型模型的立方体元数据及查询语句生成
US9760571B1 (en) * 2013-07-23 2017-09-12 jSonar Inc. Tabular DB interface for unstructured data
US9898501B2 (en) * 2013-09-12 2018-02-20 Neustar, Inc. Method and system for performing transactional updates in a key-value store
US10353923B2 (en) * 2014-04-24 2019-07-16 Ebay Inc. Hadoop OLAP engine
US10083195B2 (en) 2014-04-24 2018-09-25 Futurewei Technologies, Inc. System and method for composing a multidimensional index key in data blocks
US10698924B2 (en) * 2014-05-22 2020-06-30 International Business Machines Corporation Generating partitioned hierarchical groups based on data sets for business intelligence data models
US10025837B2 (en) * 2015-06-25 2018-07-17 Dundas Data Visualization, Inc. Systems and methods for intelligent data preparation and visualization
US10318498B2 (en) 2015-10-23 2019-06-11 Oracle International Corporation System and method for parallel support of multidimensional slices with a multidimensional database
US10838982B2 (en) 2015-10-23 2020-11-17 Oracle International Corporation System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment
US10984020B2 (en) 2015-10-23 2021-04-20 Oracle International Corporation System and method for supporting large queries in a multidimensional database environment
US10552393B2 (en) 2015-10-23 2020-02-04 Oracle International Corporation System and method for use of a dynamic flow in a multidimensional database environment
US20170116311A1 (en) 2015-10-23 2017-04-27 Oracle International Corporation System and method for use of automatic slice merge in a multidimensional database environment
US10467251B2 (en) 2015-10-23 2019-11-05 Oracle International Corporation System and method for automatic dependency analysis for use with a multidimensional database
US10346435B2 (en) 2015-10-23 2019-07-09 Oracle International Corporation System and method for improved performance in a multidimensional database environment
US10733155B2 (en) * 2015-10-23 2020-08-04 Oracle International Corporation System and method for extracting a star schema from tabular data for use in a multidimensional database environment
US11226987B2 (en) 2015-10-23 2022-01-18 Oracle International Corporation System and method for in-place data writes to reduce fragmentation in a multidimensional database environment
US10628451B2 (en) 2015-10-23 2020-04-21 Oracle International Corporation System and method for supporting queries having sub-select constructs in a multidimensional database environment
US9773029B2 (en) 2016-01-06 2017-09-26 International Business Machines Corporation Generation of a data model
US10909134B2 (en) 2017-09-01 2021-02-02 Oracle International Corporation System and method for client-side calculation in a multidimensional database environment
US10983972B2 (en) 2017-09-08 2021-04-20 Oracle International Corporation System and method for slowing changing dimension and metadata versioning in a multidimensional database environment
US11042569B2 (en) 2017-09-29 2021-06-22 Oracle International Corporation System and method for load, aggregate and batch calculation in one scan in a multidimensional database environment
US11593402B2 (en) 2017-09-29 2023-02-28 Oracle International Corporation System and method for enabling multiple parents with weights in a multidimensional database environment
US20190102447A1 (en) 2017-09-29 2019-04-04 Oracle International Corporation System and method for metadata sandboxing and what-if analysis in a multidimensional database environment

Similar Documents

Publication Publication Date Title
JP2018536909A5 (ja)
JP6846356B2 (ja) 表形式データから、多次元データベース環境に使用されるキューブスキーマを自動的に推論するためのシステムおよび方法
US20220075762A1 (en) Method for classifying an unmanaged dataset
Kane The importance of startups in job creation and job destruction
US8856157B2 (en) Automatic detection of columns to be obfuscated in database schemas
Sharma et al. Sql and nosql databases
JP2008287744A5 (ja)
JP2019531517A5 (ja)
JP2017522630A5 (ja)
CN104036051B (zh) 一种基于标签传播的数据库模式摘要生成方法
JP2015504213A5 (ja)
Gadepally et al. Big data dimensional analysis
Traub et al. The data storage and analysis system of the Swiss National Forest Inventory
US10380132B2 (en) Information landscape modeling, analysis and validation
Rabl et al. Big data generation
Dimyadi et al. Integrating the BIM rule language into compliant design audit processes
US20180357278A1 (en) Processing aggregate queries in a graph database
Bouhamoum et al. Scaling up schema discovery for RDF datasets
US20180096032A1 (en) Metadata application programming interface for ad hoc database queries
CN103999079A (zh) 对准文档的字段的注解
Seifert et al. Crowdsourcing fact extraction from scientific literature
US8694918B2 (en) Conveying hierarchical elements of a user interface
Chevalier et al. Document-oriented data warehouses: Complex hierarchies and summarizability
CN104699666B (zh) 基于近邻传播模型从图书目录中学习层次结构的方法
US8527552B2 (en) Database consistent sample data extraction