CN104657370B - 一种实现多维立方体关联的方法和装置 - Google Patents

一种实现多维立方体关联的方法和装置 Download PDF

Info

Publication number
CN104657370B
CN104657370B CN201310587065.6A CN201310587065A CN104657370B CN 104657370 B CN104657370 B CN 104657370B CN 201310587065 A CN201310587065 A CN 201310587065A CN 104657370 B CN104657370 B CN 104657370B
Authority
CN
China
Prior art keywords
cube
detail list
virtual
source table
parameter information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310587065.6A
Other languages
English (en)
Other versions
CN104657370A (zh
Inventor
刘玉娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Tianjin Co Ltd
Original Assignee
China Mobile Group Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Tianjin Co Ltd filed Critical China Mobile Group Tianjin Co Ltd
Priority to CN201310587065.6A priority Critical patent/CN104657370B/zh
Publication of CN104657370A publication Critical patent/CN104657370A/zh
Application granted granted Critical
Publication of CN104657370B publication Critical patent/CN104657370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种实现多维立方体(Cube)关联的方法,确定需要关联的Cube没有共同维度;对Cube的源表进行追踪,获取明细表;根据获得的明细表,生成动态Cube。本发明同时还公开了一种实现Cube关联的装置。通过本发明的方案,能够实现无公共维度的Cube关联,为用户提供更加便捷的数据分析。

Description

一种实现多维立方体关联的方法和装置
技术领域
本发明涉及分布式统计技术,尤其是涉及一种实现多维立方体(Cube)关联的方法和装置。
背景技术
联机分析处理(OLAP)是由关系数据库之父E.F.Codd于1993年提出的,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的要求,结构化查询语言(SQL)对大数据库的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP委员会对联机分析处理的定义为:从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业多维特性的数据称为信息数据,使分析人员、管理人员或执行人员能够从多种角度对信息数据进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
现有的多维分析方案主要有以下两种:
ROLAP:基于关系数据库的OLAP实现(Relational OLAP);以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。
MOLAP:基于多维数据组织的OLAP实现(Multidimensional OLAP);以多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成“Cube”的结构,在MOLAP中对“Cube”的“旋转”、“切块”、“切片”是产生多维数据报表的主要技术。
随着数据量的增大,上述方案中生成的Cube已不能满足用户的需求,这就需要两个或者多个Cube进行关联,以得到用户所需要的信息。
图1示出了Cube的生成过程:先由接口表通过任务(Task)生成汇总表,汇总表通过Task生成明细表,明细表再通过Task生成事实表,最后事实表通过Task生成Cube;当需要对两个或多个具有共同维度的Cube进行关联时,会形成大数据运算,例如将两个Cube的数据汇总到一个Cube中,会通过两个Cube的共同维度进行关联,然后通过关联后的数据,计算各个Cube的明细表。
因此,现有的两个方案中,在对两个Cube实现关联分析时都存在有共同的缺点:实现两个Cube的关联分析,必须要求这两个Cube具有公共维度,无公共维度的Cube无法实现关联分析。
发明内容
本发明实施例主要提供一种实现Cube关联的方法和装置,能够实现无公共维度的Cube关联,提高多Cube关联分析的效率。
本发明的技术方案是这样实现的:
本发明提供的一种实现Cube关联的方法,所述方法包括:
服务器确定需要关联的Cube没有共同维度,对所述Cube的源表进行追踪,获取明细表,根据所述明细表生成动态Cube。
上述方案中,所述服务器对所述Cube的源表进行追踪,获取明细表,包括:
所述服务器根据需要关联的Cube的元数据,查询需要关联的Cube的生成过程,获取生成需要关联的Cube的源表,根据所述源表得到明细表。
上述方案中,所述根据所述明细表,生成动态Cube,包括:
服务器对所述明细表进行解析,记录组成所述明细表的参数信息,通过所述参数信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube;其中,所述参数信息包括主键、维度和度量信息。
上述方案中,所述对生成需要关联的Cube的明细表进行关联包括:
服务器通过相同的主键信息,对生成需要关联的Cube的明细表进行关联。
上述方案中,所述根据所述虚拟明细表生成动态Cube包括:通过任务Task将虚拟明细表生成事实表,再使用结构化查询语言SQL语句将所述事实表的维度信息和度量信息结合生成动态Cube。
本发明提供的一种实现Cube关联的装置,所述装置包括:判断模块、源表分析模块和生成模块;其中,
判断模块,用于确定需要关联的Cube没有共同维度;
源表分析模块,用于对所述Cube的源表进行追踪,获取明细表;
生成模块,用于根据所述明细表,生成动态Cube。
上述方案中,所述判断模块,具体用于比较需要关联的Cube的维度信息,在没有相同的维度信息时,确定所述需要关联的Cube没有共同维度,并通知所述源表分析模块。
上述方案中,所述源表分析模块,具体用于根据需要关联的Cube的元数据,查询所述Cube的生成过程,获取生成所述Cube的源表,根据所述源表得到明细表。
上述方案中,所述生成模块,具体用于对所述明细表进行解析,记录组成所述明细表的参数信息,通过所述参数信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube;其中,所述参数信息包括主键、维度和度量信息。
上述方案中,所述生成模块包括:虚拟明细表生成模块以及Cube生成模块;其中,
虚拟明细表生成模块,用于将明细表进行关联,生成虚拟明细表;
Cube生成模块,用于根据所述虚拟明细表,生成动态Cube。
本发明实施例提供的一种实现Cube关联的方法和装置,当需要关联的Cube没有共同维度时,服务器通过对生成所述Cube的源表进行追踪,获取明细表;然后根据获取的明细表生成动态Cube;如此,能够实现无公共维度的Cube关联,提高多Cube关联分析的效率,为用户分析数据提供便利;并且通过追踪源表数据的方法,从而减小Cube关联时的系统性能消耗和执行时间。
附图说明
图1为现有技术中生成Cube的方法的流程示意图;
图2为本发明实施例一提供的实现Cube关联的方法流程示意图;
图3为本发明实施例二提供的实现Cube关联的装置的结构示意图。
具体实施方式
本发明实施例中,当需要关联的Cube没有共同维度时,服务器对所述需要关联的Cube的源表进行追踪,获取明细表,然后对明细表进行解析,获得相同的参数信息,并通过相同的参数信息,生成动态Cube,从而实现无公共维度的Cube关联,解决了没有共同维度的Cube不能关联的问题。
其中,所述需要关联的Cube,在生成过程中,具有共同的参数信息;所述参数信息包括主键信息。
下面通过附图及具体实施例对本发明做进一步的详细说明。
实施例一
本发明实施例一实现Cube关联的方法,如图2所示,该方法包括以下几个步骤:
步骤101:服务器确定需要关联的Cube没有共同维度。
具体的,服务器比较需要关联的Cube的维度信息,在没有相同的维度信息时,确定所述需要关联的Cube没有共同维度;所述服务器可以是用于数据管理的服务器,如移动公司后台的数据管理服务器。
在具有相同的维度信息时,所述服务器直接通过所述维度信息对所述需要关联的Cube进行关联。
例如,对于表1中的Cube1和表2中的Cube2,当用户需要对各个地区的各个品牌的用户数量和收入进行统计查看时,就需要对Cube1和Cube2进行关联,生成一个具有品牌信息、收入信息、在网客户数信息和收入信息的新的Cube;通过查询表3所示的Cube1的事实表1和表4所示的Cube2的事实表2,比较Cube1和Cube2是否具有共同的维度信息,由于Cube1的事实表1的维度信息为品牌信息,Cube2的维度信息为地区信息,可知Cube1和Cube2没有共同维度,所以通过Cube1的维度信息或Cube2的维度信息无法实现Cube1和Cube2的直接关联。
表1
表2
表3
表4
步骤102:服务器对所述Cube的源表进行追踪,获取明细表。
具体的,所述服务器根据所述Cube的元数据,查询所述Cube的生成过程,获取生成所述Cube的源表,根据所述源表得到明细表;其中,所述源表包括明细表和事实表。
所述元数据为记录Cube的生成过程以及底层数据逻辑关系的数据,通过所述元数据,可以追踪到生成Cube的源表,所述源表包括明细表和事实表;图1中示出了所述元数据记录的Cube的生成过程:所述Cube是由明细表通过Task生成事实表,再由所述事实表通过Task生成的;因此,通过所述元数据记录的Cube的生成过程,可以追踪到生成所述Cube的源表,从而获得明细表。
对于步骤101中的Cube1和Cube2,本步骤可以通过元数据,由Cube1的事实表1追踪到表5所示的Cube1的明细表1,由Cube2的事实表2追踪到表6所示的Cube2的明细表2。
表5
表6
步骤103:服务器根据所述明细表,生成动态Cube。
具体的,服务器对所述明细表进行解析,记录组成所述明细表的参数信息,通过所述参数信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube;其中,所述参数信息包括主键、维度和度量信息。
通过所述参数信息,对生成需要关联的Cube的明细表进行关联,一般可以是服务器通过相同的主键信息,对生成需要关联的Cube的明细表进行关联;
服务器通过Task将虚拟明细表生成事实表,使用SQL语句将所述事实表的维度信息和度量信息结合生成动态Cube。
例如,服务器可以对步骤102中的Cube1的明细表1和Cube2的明细表2进行解析,记录明细表1和明细表2的参数信息,对于Cube1:记录主键信息为用户标识信息,记录维度信息为品牌信息,记录度量信息为总收入信息;对于Cube2:记录主键信息为用户标识信息,记录维度信息为地区信息,记录度量信息为在网客户数信息;通过比较明细表1和明细表2得知,明细表1和明细表2具有相同的主键信息(即用户标识),通过相同的主键信息,对明细表1和明细表2进行关联,生成表7所示的虚拟明细表1,将虚拟明细表1结合记录的维度信息(品牌和地区)和度量信息(总收入和在网客户数),生成表8所示的动态Cube3,表8中包含了各个地区的各个品牌的用户数量和收入,从而满足了用户的需求。
表7
表8
实施例二
本发明实施例二提供了一种实现Cube关联的装置,如图3所示,所述装置包括:判断模块301、源表分析模块302以及生成模块303;其中,
判断模块301,用于确定需要关联的Cube没有共同维度;
源表分析模块302,用于对所述Cube的源表进行追踪,获取明细表;
生成模块303,用于根据所述明细表,生成动态Cube;
其中,所述需要关联的Cube为:在生成过程中,具有相同的参数信息;所述参数信息包括主键、维度和度量信息;
具体的,所述判断模块301比较需要关联的Cube的维度信息,在没有相同的维度信息时,确定所述需要关联的Cube没有共同维度,并通知所述源表分析模块302;
其中,在具有相同的维度信息时,直接通过所述维度信息对所述需要关联的Cube进行关联;
所述源表分析模块302根据需要关联的Cube的元数据,查询所述Cube的生成过程,获取生成所述Cube的源表,根据所述源表得到明细表;其中,所述源表包括明细表和事实表;
其中,所述元数据为记录Cube的生成过程以及底层数据逻辑关系的数据,通过所述元数据,可以追踪到生成Cube的明细表。
所述生成模块303,具体用于对所述明细表进行解析,记录组成所述明细表的参数信息,通过所述参数信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube;其中,所述参数信息包括主键、维度和度量信息;
具体的,所述生成模块303通过相同的主键信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,通过Task将虚拟明细表生成事实表,使用SQL语句将所述事实表的维度信息和度量信息结合生成动态Cube。
其中,所述判断模块301可以由服务器的CPU进行实现,或者由对比电路进行实现;
所述源表分析模块302可以由服务器的CPU和内存或硬盘进行实现;
所述生成模块303可以由服务器的CPU和显示器进行实现。
所述生成模块303包括:虚拟明细表生成模块401以及Cube生成模块402;其中,
虚拟明细表生成模块401,用于将明细表进行关联,生成虚拟明细表;
Cube生成模块402,用于根据所述虚拟明细表,生成动态Cube;
具体的,所述虚拟明细表生成模块401通过相同的主键信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表;所述Cube生成模块402通过Task将虚拟明细表生成事实表,使用SQL语句将所述事实表的维度信息和度量信息结合生成动态Cube。
通过本发明所提供的方法和装置,能够对无公共维度的Cube进行关联;通过追踪到生成所述Cube的明细表,查询相同的主键信息,通过所述主键进行关联合并生成虚拟明细表,再将所述虚拟明细表生成动态Cube,实现对无公共维度的Cube的关联,提高系统的运行效率,为用户提供所需要关联的相关信息。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种实现多维立方体Cube关联的方法,其特征在于,所述方法包括:
服务器确定需要关联的Cube没有共同维度,对所述Cube的源表进行追踪,获取并解析明细表,获得相同的参数信息,通过所述参数信息,对所述Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube。
2.根据权利要求1所述的方法,其特征在于,所述对所述Cube的源表进行追踪,获取并解析明细表,包括:
所述服务器根据需要关联的Cube的元数据,查询需要关联的Cube的生成过程,获取生成需要关联的Cube的源表,根据所述源表得到明细表。
3.根据权利要求2所述的方法,其特征在于,所述获取并解析明细表之后,还包括:
记录组成所述明细表的参数信息;其中,所述参数信息包括主键、维度和度量信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述Cube的明细表进行关联包括:
服务器通过相同的主键信息,对生成需要关联的Cube的明细表进行关联。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述虚拟明细表生成动态Cube包括:通过任务Task将虚拟明细表生成事实表,再使用结构化查询语言SQL语句将所述事实表的维度信息和度量信息结合生成动态Cube。
6.一种实现多维立方体Cube关联的装置,其特征在于,所述装置包括:判断模块、源表分析模块和生成模块;其中,
判断模块,用于确定需要关联的Cube没有共同维度;
源表分析模块,用于对所述Cube的源表进行追踪,获取明细表;
生成模块,用于解析所述明细表,获得相同的参数信息,通过所述参数信息,对Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表,生成动态Cube。
7.根据权利要求6所述的装置,其特征在于,所述判断模块,具体用于比较需要关联的Cube的维度信息,在没有相同的维度信息时,确定所述需要关联的Cube没有共同维度,并通知所述源表分析模块。
8.根据权利要求6所述的装置,其特征在于,所述源表分析模块,具体用于根据需要关联的Cube的元数据,查询所述Cube的生成过程,获取生成所述Cube的源表,根据所述源表得到明细表。
9.根据权利要求6所述的装置,其特征在于,所述生成模块,具体用于对所述明细表进行解析,记录组成所述明细表的参数信息,通过所述参数信息,对生成需要关联的Cube的明细表进行关联,得到虚拟明细表,根据所述虚拟明细表生成动态Cube;其中,所述参数信息包括主键、维度和度量信息。
10.根据权利要求9所述的装置,其特征在于,所述生成模块包括:虚拟明细表生成模块以及Cube生成模块;其中,
虚拟明细表生成模块,用于将明细表进行关联,生成虚拟明细表;
Cube生成模块,用于根据所述虚拟明细表,生成动态Cube。
CN201310587065.6A 2013-11-19 2013-11-19 一种实现多维立方体关联的方法和装置 Active CN104657370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310587065.6A CN104657370B (zh) 2013-11-19 2013-11-19 一种实现多维立方体关联的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310587065.6A CN104657370B (zh) 2013-11-19 2013-11-19 一种实现多维立方体关联的方法和装置

Publications (2)

Publication Number Publication Date
CN104657370A CN104657370A (zh) 2015-05-27
CN104657370B true CN104657370B (zh) 2018-09-04

Family

ID=53248517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310587065.6A Active CN104657370B (zh) 2013-11-19 2013-11-19 一种实现多维立方体关联的方法和装置

Country Status (1)

Country Link
CN (1) CN104657370B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897386B (zh) * 2017-01-23 2019-10-29 武汉奇米网络科技有限公司 一种大数据多维分析方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1564160A (zh) * 2004-04-22 2005-01-12 重庆市弘越科技有限公司 建立及查询多维数据立方体的方法
CN1726495A (zh) * 2003-01-13 2006-01-25 国际商业机器公司 规定用于关系olap引擎的多维计算
CN101178732A (zh) * 2007-12-12 2008-05-14 江苏省电力公司 基于元数据快速实现数据仓库过程的方法
CN101799830A (zh) * 2010-03-25 2010-08-11 北京国双科技有限公司 可实现多维度自由剖析的流量数据处理方法
CN102207940A (zh) * 2010-03-31 2011-10-05 国际商业机器公司 用于验证数据的方法和系统
CN102737123A (zh) * 2012-06-13 2012-10-17 北京五八信息技术有限公司 一种多维数据分布方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7593955B2 (en) * 2004-11-30 2009-09-22 International Business Machines Corporation Generation of aggregatable dimension information within a multidimensional enterprise software system
CN102141992B (zh) * 2010-01-28 2015-04-29 广州市西美信息科技有限公司 多维数据库存储及查询的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1726495A (zh) * 2003-01-13 2006-01-25 国际商业机器公司 规定用于关系olap引擎的多维计算
CN1564160A (zh) * 2004-04-22 2005-01-12 重庆市弘越科技有限公司 建立及查询多维数据立方体的方法
CN101178732A (zh) * 2007-12-12 2008-05-14 江苏省电力公司 基于元数据快速实现数据仓库过程的方法
CN101799830A (zh) * 2010-03-25 2010-08-11 北京国双科技有限公司 可实现多维度自由剖析的流量数据处理方法
CN102207940A (zh) * 2010-03-31 2011-10-05 国际商业机器公司 用于验证数据的方法和系统
CN102737123A (zh) * 2012-06-13 2012-10-17 北京五八信息技术有限公司 一种多维数据分布方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种数据仓库的多维数据模型;李建中等;《软件学报》;20000707;第11卷(第7期);第908-917页 *
数据立方体生成技术研究;刘红敏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20071115(第05期);第I138-987页 *

Also Published As

Publication number Publication date
CN104657370A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
US11762882B2 (en) System and method for analysis and management of data distribution in a distributed database environment
CN109669934B (zh) 一种切合电力客服业务的数据仓库系统及其构建方法
EP2263180B1 (en) Indexing large-scale gps tracks
US9189535B2 (en) Compensating for unbalanced hierarchies when generating OLAP queries from report specifications
CN107408114B (zh) 基于事务访问模式识别联结关系
CN109656958B (zh) 数据查询方法以及系统
CN103440288A (zh) 一种大数据存储方法及装置
US9123006B2 (en) Techniques for parallel business intelligence evaluation and management
WO2023093607A1 (zh) 一种离线数据模糊搜索方法、装置、设备和介质
Peng et al. Query workload-based RDF graph fragmentation and allocation
US11809468B2 (en) Phrase indexing
CN101751400A (zh) 技术数据分析的系统与方法以及专利分析的系统
CN105095436A (zh) 数据源数据自动建模方法
CN115794929A (zh) 数据集市的数据管理系统和数据管理方法
US8589451B1 (en) Systems and methods for generating a common data model for relational and object oriented databases
CN104750853A (zh) 一种异构数据搜索方法及装置
CN114661832A (zh) 一种基于数据质量的多模态异构数据存储方法及系统
CN114064660A (zh) 基于ElasticSearch的数据结构化分析方法
CN112988783A (zh) 一种基于多维数据模型的舆情发生时序分析方法
CN107341198B (zh) 一种基于主题实例的电力海量数据存储和查询方法
CN104657370B (zh) 一种实现多维立方体关联的方法和装置
CN113342843A (zh) 大数据在线分析方法和系统
CN110134688B (zh) 一种在线社交网络中热点事件数据存储管理方法及系统
CN105574027A (zh) 基于oltp/olap混合应用下多维度性能数据存储方法、装置及系统
CN116700917A (zh) 一种数据决策平台及使用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant