CN104376020B

CN104376020B - 多维数据的处理方法及装置

Info

Publication number: CN104376020B
Application number: CN201310357622.5A
Authority: CN
Inventors: 曾伟纪; 李�浩; 武磊; 蔡馥晗
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2013-08-16
Filing date: 2013-08-16
Publication date: 2019-01-29
Anticipated expiration: 2033-08-16
Also published as: US9811578B2; US20150213108A1; TWI514176B; CN104376020A; WO2015021850A1; TW201508524A

Abstract

本发明实施例公开了一种多维数据的处理方法及装置，涉及计算机技术领域，解决了从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。方法包括：获取数据业务中的维度信息中的属性信息及各属性的层级关系信息，并生成递推拓扑；递推拓扑包括属性组合集及各属性组合之间的递推路径；在属性组合集中确定待查询属性组合；根据待查询属性组合在属性组合集中确定待固化属性组合；对待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据；根据所述递推路径和所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。本发明适用于多维数据分析中。

Description

多维数据的处理方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种多维数据的处理方法及装置。

背景技术

当前，随着计算机技术的不断发展，多维数据分析在各种数据分析平台上得到了广泛的应用。多维数据分析源于联机分析处理OLAP(On-Line Analytical Processing，简称OLAP)技术，是OLAP技术的核心，目的是从多个维度来观察和分析指标的变化，以突出展示一些通过筛选重要维度而获得的指标数据。

在传统的OLAP服务中，一般提供了两种查询服务策略。一种是预先固化好一些属性组合，即预先设置了属性组合，并获取到该属性组合所对应的指标数据，当接收到查询请求时，若查询请求包括该属性组合，则直接向用户展示指标数据，而若查询请求不包括预先固化好的属性组合，则不提供查询服务，或者从流水数据出发进行计算。另一种方式是没有预先固化任何属性组合，在接收到查询请求后，根据查询请求中的属性组合，从流水数据出发，进行计算。

当前，随着流水数据的数据量增大，维度及每个维度下的属性较多，从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高。

发明内容

本发明的实施例提供一种多维数据的处理方法及装置，能够解决现有技术中由于从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。

为达到上述目的，本发明采用如下技术方案：

一种多维数据的处理方法，包括：

获取数据业务中的维度信息中的属性信息及各属性的层级关系信息，并根据所述维度信息中的属性信息及各属性的层级关系信息生成递推拓扑；所述递推拓扑包括属性组合集及所述属性组合集中的各属性组合之间的递推路径；

在所述属性组合集中确定待查询属性组合；

根据所述待查询属性组合在所述属性组合集中确定待固化属性组合；

对所述待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据；

根据所述递推路径和所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。

一种多维数据的处理装置，包括：

获取单元，用于获取数据业务中的维度信息中的属性信息及各属性的层级关系信息；

生成单元，用于根据所述获取单元获取的所述维度信息中的属性信息及各属性的层级关系信息生成递推拓扑；所述递推拓扑包括属性组合集及所述属性组合集中的各属性组合之间的递推路径；

确定单元，用于在所述生成单元生成的所述属性组合集中确定待查询属性组合；

所述确定单元，还用于根据所述待查询属性组合在所述属性组合集中确定待固化属性组合；

固化单元，用于对所述确定单元确定的所述待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据；

递推单元，用于根据所述生成单元生成的所述递推路径和所述固化单元固化的所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。

本发明实施例提供的多维数据的处理方法及装置，由于确定了待查询属性组合，并通过待查询属性组合确定了待固化属性组合，并对待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据，根据生成的递推拓扑递推所述待查询属性组合所对应的指标数据，从而要获取待查询属性组合对应的指标数据时，无需从流水数据中获取，运算代价较小，运算复杂度较低。而现有技术中，每次获取指标数据，均是从流水数据出发来获取，运算代价较大，运算复杂度较高。因此，本发明能够解决从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的多维数据的处理方法的流程图；

图2为本发明又一实施例提供的多维数据的处理方法的流程图；

图3为本发明实施例中的一种递推拓扑的示意图；

图4为本发明实施例提供的多维数据的处理装置的结构示意图一；

图5为本发明实施例提供的多维数据的处理装置的结构示意图二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明技术方案的优点更加清楚，下面结合附图和实施例对本发明作详细说明。

如图1所示，本发明实施例提供的多维数据的处理方法，包括：

101、获取数据业务中的维度信息中的属性信息及各属性的层级关系信息，并根据所述维度信息中的属性信息及各属性的层级关系信息生成递推拓扑。

其中，所述递推拓扑包括属性组合集及所述属性组合集中的各属性组合之间的递推路径。所述递推拓扑用于在查询待查询属性组合时，能够根据所述递推拓扑中的已固化属性组合的指标数据直接递推出所述待查询属性组合的指标数据。在多维数据分析中，所述属性组合一般是由多个维度的属性组成的，其中维度用于分析数据的视角，例如某一应用程序被应用，那么应用该应用程序的用户所在地域、用户的年龄等即为维度。所述属性信息是在同一维度下，描述该维度的不同粒度，例如一个时间维度可以包括日、周、月、年等属性。所述各属性的层级关系信息中包括各种属性的层级关系，例如在地域维度中，一个国家包括多个省份，一个省份又包括多个城市，例如中国包括很多省份，如广东省、广西省等，而广东省又包括深圳市、广州市、东莞市等。

102、在所述属性组合集中确定待查询属性组合。

具体可以是先获取一预设时间内各属性组合被查询的查询统计数据，从而根据各属性组合被查询的查询统计数据来获取到所述待查询属性组合。例如，在所述查询统计数据中被查询的频率较高的属性组合作为待查询属性组合。

103、根据所述待查询属性组合在所述属性组合集中确定待固化属性组合。

具体的，确定待固化属性组合是为了在之后形成固化属性组合，进而从流水数据中获取所述固化属性组合所对应的指标数据。在递推拓扑中，存在大量属性组合，可以根据待查询属性组合的权重以及各属性组合上卷到待查询属性组合的代价来确定待固化属性组合。

104、对所述待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据。

105、根据所述递推路径和所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。

由于已经根据该待查询属性组合确定了优选的待固化属性组合，并形成了固化属性组合，并从流水数据中获取了所述固化属性组合所对应的指标数据，则在要获取待查询属性组合所对应的指标数据时，能够通过固化属性组合所对应的指标数据递推得到。所述根据所述递推路径和所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据的步骤可以是在接收到查询指令时触发的，但不仅局限于此。

值得说明的是，本发明实施例提供的多维数据的处理方法的执行主体可以是一种多维数据的处理装置，所述多维数据的处理装置可以运行于计算机、网络服务器等电子设备中，但不仅局限于此。

本发明实施例提供的多维数据的处理方法，由于确定了待查询属性组合，并通过待查询属性组合确定了待固化属性组合，并对待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据，根据生成的递推拓扑递推所述待查询属性组合所对应的指标数据，从而要获取待查询属性组合对应的指标数据时，无需从流水数据中获取，运算代价较小，运算复杂度较低。而现有技术中，每次获取指标数据，均是从流水数据出发来获取，运算代价较大，运算复杂度较高。因此，本发明能够解决从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。

下面列举一个更为具体的实施例，如图2所示，本发明又一实施例提供的多维数据的处理方法，包括：

201、获取数据业务中的维度信息中的属性信息及各属性的层级关系信息，并根据所述维度信息中的属性信息及各属性的层级关系信息生成递推拓扑。

其中，所述递推拓扑包括属性组合集及所述属性组合集中的各属性组合之间的递推路径。所述递推拓扑用于在查询待查询属性组合时，能够根据所述递推拓扑中的已固化属性组合的指标数据直接递推出所述待查询属性组合的指标数据。在多维数据分析中，所述属性组合一般是由多个维度的属性组成的，其中维度用于分析数据的视角。所述属性信息是在同一维度下，描述该维度的不同粒度，例如一个时间维度可以包括日、周、月、年等属性。所述各属性的层级关系信息中包括各种属性的层级关系。例如，如图3所示，列举了一种递推拓扑的简单例子，其中该递推拓扑中仅有两个维度：地域维度和年龄维度，地域维度包括的属性为：城市和省份，年龄维度则只有一个属性：年龄数。具体的，顶层属性组合为城市、年龄数属性组合，通过上卷操作，可以得到的属性组合为省份、年龄数属性组合、城市属性、年龄数属性，之后省份、年龄数属性组合继续上卷，可以得到省份属性、年龄数属性。同样的，通过城市属性上卷可以得到省份属性、总览属性；通过年龄数属性上卷可以得到总览属性；通过省份属性上卷可以得到总览属性。最终的总览属性中已经没有地域维度和年龄维度，即没有属性组合的限制。

202、获取一预设时间内各属性组合被查询的查询统计数据。

其中，所述查询统计数据包括所述各属性组合在该预设时间内被查询的频率以及被查询的时间分布信息；所述预设时间可以根据需求确定，例如可以是当前时间前一周、一个月、一年等，但不仅局限于此。所述被查询的频率可以表示为在所述预设时间内被查询的次数，例如某一属性组合在一个月内被查询100次等。所述被查询的时间分布信息用于表示在所述预设时间内被查询的分布情况，例如所述预设时间为一周，在一周中，某一属性组合星期一至星期五被查询的次数为1000次，而星期六至星期日被查询的次数为9000次。这样，通过在该预设时间内被查询的频率以及被查询的时间分布信息，可以预测各属性组合在当前时间过后的一段时间内被查询的情况。由于各属性组合被查询的查询统计数据在不同时间的变化较快，所以可以采用按照一定频率来获取各属性组合被查询的查询统计数据，以适应可能的查询统计数据的变化。

203、根据所述被查询的频率以及所述被查询的时间分布信息，确定所述各属性组合的权重。

在没有被查询的时间分布信息影响下，可以按照被查询的频率确定各属性组合的权重，例如频率高的权重较大。在有被查询的时间分布信息影响下，可以综合被查询的频率以及所述被查询的时间分布信息来确定所述属性组合的权重。例如上述的在一周中，某一属性组合星期一至星期五被查询的次数为1000次，而星期六至星期日被查询的次数为9000次，则若待查询的属性组合所处的查询时间为星期六至星期日，则不仅要按照一周10000次的频率来确定该属性组合的权重，还要提高根据频率而确定的属性组合的权重。

204、获取权重调整策略，根据所述权重调整策略，对所述各属性组合的权重进行调整。

此外，在确定各属性组合的权重后，还可以获取权重调整策略，所述权重调整策略用于对各属性组合的权重进行调整。由于步骤203中确定的各属性组合的权重有可能存在偏差，则需要根据权重调整策略进行权重调整。例如，在各属性组合中的某一属性组合权重较高，但是该属性组合中的某一属性在系统维护时已经被删除，则之后不能够查询到所述属性组合，则可以直接将该属性组合的权重置为零。所述权重调整策略中还可以包括权重确定策略，用于调整确定各属性组合的权重的方式，例如增加影响权重的内容等。

205、根据所述各属性组合的权重，从各属性组合中确定待查询属性组合，并记录所述待查询属性组合的权重。

从各属性组合中确定待查询属性组合可以是按照权重从大到小，获取预设个数的属性组合。或者可以是确定权重大于一预设阈值的属性组合为待查询属性组合。

206、确定待固化属性组合的数量。

所述确定待固化属性组合的数量可以是根据存储固化属性组合的数据库的存储能力，以及所需要的服务质量标准来确定。例如所述数据库仅可存储50个固化属性组合，则所述待固化属性组合的数量可为50。在所述存储固化属性组合的数据库的存储能力允许下，所述待固化属性组合的数量可以较大。

207、遍历所述属性组合集，判断所述属性组合集中是否有所述固化属性组合。

若判断到所述属性组合集中没有所述固化属性组合，执行步骤208。否则，若判断到所述属性组合集中有所述固化属性组合，执行步骤218。

208、从所述属性组合集中选取一个属性组合。

209、判断所述属性组合与待查询属性组合是否相同。

若所述属性组合与待查询属性组合相同，执行步骤210。若所述属性组合与待查询属性组合不相同，执行步骤211。

210、确定所述属性组合上卷到所述待查询属性组合的代价值为零。在步骤210之后，继续执行步骤212。

211、获取所述属性组合的记录条数，并根据所述记录条数确定所述属性组合上卷到所述待查询属性组合的代价值。在步骤211之后，继续执行步骤212。

一般情况下，上卷计算的耗时时间与父属性的记录条数成正比，所述耗时时间越大，则所述上卷计算的耗时时间也越大，因此，所述上卷到所述待查询属性组合的代价值与所述记录条数成正比。此处可以以所述记录条数作为所述代价值的表示方式。

所述属性组合的记录条数的确定方式可以公式一：

其中，N为记录条数，A^*表示属性组合中的各属性，P_A表示属性A的所有不同取值的个数，为折损系数，用于修正由于部分取值的缺失导致的估算与实际数值之间的差异，从而提高所确定的记录条数的精确度。例如，A^*表示属性组合中的各属性为属性一、属性二和属性三，属性一有2个取值、属性二有2个取值、属性三有30个取值，则在无折损的情况下，记录条数为2*2*30，为120个。所述的取值范围为(0，1],例如，的取值为0.8，则上述记录条数为0.8*120，为96条。

212、根据所述属性组合上卷到各待查询属性组合的代价值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值。

例如所述属性组合为v₁，待查询属性组合为x₁，x₁的权重为weight_x1，则对于属性组合x₁，所述加权查询代价值C_x1为公式二：

其中{v₁}是仅有属性组合v₁的集合，cost({v₁}，x₁)为属性组合v₁上卷到待查询属性组合x₁的代价值，可以以属性组合v₁的记录条数表示，若属性组合v₁与待查询属性组合x₁相同，则可确定属性组合v₁上卷到待查询属性组合x₁的代价值为0。

213、将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。在步骤213之后，返回执行步骤208，以获取到各属性组合对应的整体加权查询代价值，之后执行步骤214。

例如，所述属性组合为v₁，待查询属性组合为x，x包括x₁、x₂、x₃等，则属性组合v₁对应的整体加权查询代价值C₁可以表示为如下公式三：

C₁＝∑_{x∈t_views}weight_x*cost({v₁},x)

其中，在此处的{v₁}集合中，仅有属性组合v₁，t_views表示待查询属性组合的集合，可以有多个待查询属性组合。weight_x表示待查询属性组合x对应的权重，cost({v₁}，x)为属性组合v₁上卷到待查询属性组合x的代价值，其中x可以取值x₁、x₂、x₃等。

此外，根据公式三的方式，在属性组合为v₂、v₃、v₄等时，相应可以获取到各自对应的整体加权查询代价值C₂、C₃、C₄等。

214、根据所述各属性组合对应的整体加权查询代价值，确定最小整体加权查询代价值。

例如在得到C₁、C₂、C₃、C₄等整体加权代价值后，可以确定一个最小整体加权查询代价值。

215、确定所述最小整体加权查询代价值所对应的属性组合为待固化属性组合。

216、对所述待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据。

由于已经根据该待查询属性组合确定了优选的待固化属性组合，并形成了固化属性组合，并从流水数据中获取了所述固化属性组合所对应的指标数据，则在要获取待查询属性组合所对应的指标数据时，能够通过固化属性组合所对应的指标数据递推得到。

217、根据所述递推路径和所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。

218、提取各固化属性组合，并在各未固化属性组合中选取一个属性组合。在步骤218之后执行步骤219和步骤222。

其中，所述未固化属性组合在所述属性组合集中。若属性组合集中已经有固化属性组合，则该固化属性组合对后续得到的整体加权代价值也有影响，因此要提取各固化属性组合。

219、判断所述属性组合与待查询属性组合是否相同。若判断到所述属性组合与待查询属性组合相同，执行步骤220。若判断到所述属性组合与待查询属性组合不相同，执行步骤221。

220、确定所述属性组合上卷到所述待查询属性组合的代价值为零。在步骤220之后执行步骤225。

221、获取所述属性组合的记录条数，并根据所述记录条数确定所述属性组合上卷到所述待查询属性组合的代价值。在步骤221之后执行步骤225。

其具体实现方式可以参见步骤211下的具体实现方式，此处不再赘述。

222、判断各固化属性组合与待查询属性组合是否相同。若判断到所述固化属性组合与待查询属性组合相同，执行步骤223。若判断到所述固化属性组合与待查询属性组合不相同，执行步骤224。

223、确定所述固化属性组合上卷到所述待查询属性组合的代价值为零。在步骤223之后执行步骤225。

224、获取所述固化属性组合的记录条数，并根据所述记录条数确定所述固化属性组合上卷到所述待查询属性组合的代价值。在步骤224之后执行步骤225。

225、确定所述上卷到一待查询属性组合的代价值的最小值。

例如，以m_views表示固化属性组合的集合，x表示待查询属性组合，v₁表示选取的一个属性组合。则待查询属性组合的代价值的最小值为公式四：

其中{v₁}是仅有属性组合v₁的集合，cost(m_views∪{v₁}，x)表示在v₁下确定的待查询属性组合的代价值的最小值，a∈m_views∪{v₁}表示a在固化属性组合的集合与{v₁}集合的并集中，也就是a可以是属性组合v₁，也可以是一个固化属性组合，r(a，x)表示从属性组合a上卷到属性组合x的代价值，x可以取x₁、x₂、x₃等，从而得到各待查询属性组合对应的所述最小值。

226、根据各待查询属性组合对应的所述最小值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值。

例如所述属性组合为v₁，待查询属性组合为x₁，x₁的权重为weight_x1，则对于属性组合x₁，所述加权查询代价值C_x1为公式五：

其中，cost(m_views∪{v₁}，x₁)为固化属性组合的集合与{v₁}集合的并集上卷到一待查询属性组合x₁的代价值的最小值，在此处的{v₁}集合中，仅有属性组合v₁。

227、将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。在步骤227之后，返回执行步骤218，以获取到各属性组合对应的整体加权查询代价值，之后执行步骤214。

例如，所述属性组合为v₁，待查询属性组合为x，x包括x₁、x₂、x₃等，则属性组合v₁对应的整体加权查询代价值C₁可以表示为如下公式六：

C₁＝∑_{x∈t_views}weight_x*cost(m_views∪{v₁}，x)

其中，t_views表示待查询属性组合的集合，可以有多个待查询属性组合。weight_x表示待查询属性组合x对应的权重，cost(m_views∪{v₁}，x)为固化属性组合的集合与{v₁}集合的并集上卷到待查询属性组合x的代价值的最小值，其中x可以取值x₁、x₂、x₃等。

此外，根据公式六的方式，在属性组合为v₂、v₃、v₄等时，相应可以获取到各自对应的整体加权查询代价值C₂、C₃、C₄等。从而在后续步骤214中，在得到C₁、C₂、C₃、C₄等整体加权代价值后，可以确定一个最小整体加权查询代价值。

值得说明的是，本发明又一实施例提供的多维数据的处理方法的执行主体可以是一种多维数据的处理装置，所述多维数据的处理装置可以运行于计算机、网络服务器等电子设备中，但不仅局限于此。

本发明又一实施例提供的多维数据的处理方法，由于确定了待查询属性组合，并通过待查询属性组合确定了待固化属性组合，并对待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据，根据生成的递推拓扑递推所述待查询属性组合所对应的指标数据，从而要获取待查询属性组合对应的指标数据时，无需从流水数据中获取，运算代价较小，运算复杂度较低。而现有技术中，每次获取指标数据，均是从流水数据出发来获取，运算代价较大，运算复杂度较高。因此，本发明能够解决从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。

对应于图1和图2所示的多维数据的处理方法的实施例，如图4所示，本发明实施例提供的多维数据的处理装置，包括：

获取单元31，用于获取数据业务中的维度信息中的属性信息及各属性的层级关系信息。

生成单元32，用于根据所述获取单元31获取的所述维度信息中的属性信息及各属性的层级关系信息生成递推拓扑；所述递推拓扑包括属性组合集及所述属性组合集中的各属性组合之间的递推路径。

确定单元33，用于在所述生成单元32生成的所述属性组合集中确定待查询属性组合。

所述确定单元33，还用于根据所述待查询属性组合在所述属性组合集中确定待固化属性组合。

固化单元34，用于对所述确定单元33确定的所述待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据；

递推单元35，用于根据所述生成单元32生成的所述递推路径和所述固化单元34固化的所述固化属性组合所对应的指标数据，递推所述待查询属性组合所对应的指标数据。

进一步的，如图5所示，所述确定单元33，包括：

获取模块331，用于获取一预设时间内各属性组合被查询的查询统计数据。

其中，所述查询统计数据包括所述各属性组合在该预设时间内被查询的频率以及被查询的时间分布信息。

确定模块332，用于根据所述被查询的频率以及所述被查询的时间分布信息，确定所述各属性组合的权重。

所述确定模块332，还用于根据所述各属性组合的权重，从各属性组合中确定待查询属性组合。

记录模块333，用于记录所述待查询属性组合的权重。

进一步的，如图5所示，所述获取单元31，还用于：

获取权重调整策略，根据所述权重调整策略，对所述各属性组合的权重进行调整。

进一步的，如图5所示，所述确定单元33，还用于：

确定待固化属性组合的数量。

进一步的，如图5所示，所述获取模块331，还用于：

获取所述属性组合集中的各属性组合对应的整体加权查询代价值。

所述确定模块332，还用于根据所述各属性组合对应的整体加权查询代价值，确定最小整体加权查询代价值。

所述确定模块332，还用于确定所述最小整体加权查询代价值所对应的属性组合为待固化属性组合。

具体的，如图5所示，所述多维数据的处理装置，还包括：

判断单元36，用于遍历所述属性组合集，判断所述属性组合集中是否有所述固化属性组合。

具体的，如图5所示，所述获取模块331，包括：

选取子模块3311，用于在所述判断单元36判断到所述属性组合集中没有所述固化属性组合，从所述属性组合集中选取一个属性组合。

获取子模块3312，用于获取所述属性组合上卷到各待查询属性组合的代价值。

确定子模块3313，用于根据所述属性组合上卷到各待查询属性组合的代价值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值。

求和子模块3314，用于将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。

如图5所示，所述获取模块331，还包括：

判断子模块3315，用于判断所述属性组合与待查询属性组合是否相同。

具体的，所述获取子模块3315，用于：

若判断到所述属性组合与待查询属性组合相同，确定所述属性组合上卷到所述待查询属性组合的代价值为零。

若判断到所述属性组合与待查询属性组合不相同，获取所述属性组合的记录条数，并根据所述记录条数确定所述属性组合上卷到所述待查询属性组合的代价值。

如图5所示，选取子模块3311，还用于在所述判断单元36判断到所述属性组合集中有所述固化属性组合，提取各固化属性组合，并在各未固化属性组合中选取一个属性组合。所述未固化属性组合在所述属性组合集中。

获取子模块3312，还用于获取各固化属性组合和所述属性组合上卷到一待查询属性组合的代价值。

确定子模块3313，还用于确定所述上卷到一待查询属性组合的代价值的最小值。

所述确定子模块3313，还用于根据各待查询属性组合对应的所述最小值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值。

求和子模块3314，还用于将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。

所述判断子模块3315，还用于判断所述各固化属性组合和所述属性组合与待查询属性组合是否相同。

具体的，如图5所示，所述获取子模块3312，用于：

若判断到所述固化属性组合与待查询属性组合相同，确定所述固化属性组合上卷到所述待查询属性组合的代价值为零。

若判断到所述固化属性组合与待查询属性组合不相同，获取所述固化属性组合的记录条数，并根据所述记录条数确定所述固化属性组合上卷到所述待查询属性组合的代价值。

值得说明的是，本发明实施例提供的多维数据的处理装置可以运行于计算机、网络服务器等电子设备中，但不仅局限于此。本发明实施例提供的多维数据的处理装置的具体实施方式参见图1和图2中的多维数据的处理方法的具体实施例，此处不再赘述。

本发明实施例提供的多维数据的处理装置，由于确定了待查询属性组合，并通过待查询属性组合确定了待固化属性组合，并对待固化属性组合进行固化，形成固化属性组合，从流水数据中获取所述固化属性组合所对应的指标数据，根据生成的递推拓扑递推所述待查询属性组合所对应的指标数据，从而要获取待查询属性组合对应的指标数据时，无需从流水数据中获取，运算代价较小，运算复杂度较低。而现有技术中，每次获取指标数据，均是从流水数据出发来获取，运算代价较大，运算复杂度较高。因此，本发明能够解决从流水数据出发来获取各个属性组合下的指标数据，运算代价较大，运算复杂度较高的问题。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种多维数据的处理方法，其特征在于，包括：

在所述属性组合集中确定待查询属性组合；

2.根据权利要求1所述的多维数据的处理方法，其特征在于，所述在所述属性组合集中确定待查询属性组合，包括：

获取一预设时间内各属性组合被查询的查询统计数据；所述查询统计数据包括所述各属性组合在该预设时间内被查询的频率以及被查询的时间分布信息；

根据所述被查询的频率以及所述被查询的时间分布信息，确定所述各属性组合的权重；

根据所述各属性组合的权重，从各属性组合中确定待查询属性组合，并记录所述待查询属性组合的权重。

3.根据权利要求2所述的多维数据的处理方法，其特征在于，在所述根据所述各属性组合的权重，从各属性组合中确定待查询属性组合之前，包括：

4.根据权利要求1所述的多维数据的处理方法，其特征在于，在所述根据所述待查询属性组合在所述属性组合集中确定待固化属性组合之前，包括：

确定待固化属性组合的数量。

5.根据权利要求2所述的多维数据的处理方法，其特征在于，所述根据所述待查询属性组合在所述属性组合集中确定待固化属性组合，包括：

获取所述属性组合集中的各属性组合对应的整体加权查询代价值；

根据所述各属性组合对应的整体加权查询代价值，确定最小整体加权查询代价值；

确定所述最小整体加权查询代价值所对应的属性组合为待固化属性组合。

6.根据权利要求5所述的多维数据的处理方法，其特征在于，在所述获取所述属性组合集中的各属性组合对应的整体加权查询代价值之前，包括：

遍历所述属性组合集，判断所述属性组合集中是否有所述固化属性组合。

7.根据权利要求6所述的多维数据的处理方法，其特征在于，所述获取所述属性组合集中的各属性组合对应的整体加权查询代价值，包括：

若判断到所述属性组合集中没有所述固化属性组合，从所述属性组合集中选取一个属性组合；

获取所述属性组合上卷到各待查询属性组合的代价值；

根据所述属性组合上卷到各待查询属性组合的代价值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值；

将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。

8.根据权利要求7所述的多维数据的处理方法，其特征在于，在所述获取所述属性组合上卷到各待查询属性组合的代价值之前，包括：

判断所述属性组合与待查询属性组合是否相同。

9.根据权利要求8所述的多维数据的处理方法，其特征在于，所述获取所述属性组合上卷到各待查询属性组合的代价值，包括：

若判断到所述属性组合与待查询属性组合相同，确定所述属性组合上卷到所述待查询属性组合的代价值为零；

10.根据权利要求6所述的多维数据的处理方法，其特征在于，所述获取所述属性组合集中的各属性组合对应的整体加权查询代价值，包括：

若判断到所述属性组合集中有所述固化属性组合，提取各固化属性组合，并在各未固化属性组合中选取一个属性组合；所述未固化属性组合在所述属性组合集中；

获取各固化属性组合和所述属性组合上卷到一待查询属性组合的代价值；

确定所述上卷到一待查询属性组合的代价值的最小值；

根据各待查询属性组合对应的所述最小值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值；

11.根据权利要求10所述的多维数据的处理方法，其特征在于，在所述获取各固化属性组合和所述属性组合上卷到一待查询属性组合的代价值之前，包括：

判断所述各固化属性组合和所述属性组合与待查询属性组合是否相同。

12.根据权利要求11所述的多维数据的处理方法，其特征在于，所述获取各固化属性组合和所述属性组合上卷到一待查询属性组合的代价值，包括：

若判断到所述固化属性组合与待查询属性组合相同，确定所述固化属性组合上卷到所述待查询属性组合的代价值为零；

若判断到所述属性组合与待查询属性组合不相同，获取所述属性组合的记录条数，并根据所述记录条数确定所述属性组合上卷到所述待查询属性组合的代价值；

13.一种多维数据的处理装置，其特征在于，包括：

14.根据权利要求13所述的多维数据的处理装置，其特征在于，所述确定单元，包括：

获取模块，用于获取一预设时间内各属性组合被查询的查询统计数据；所述查询统计数据包括所述各属性组合在该预设时间内被查询的频率以及被查询的时间分布信息；

确定模块，用于根据所述被查询的频率以及所述被查询的时间分布信息，确定所述各属性组合的权重；

所述确定模块，还用于根据所述各属性组合的权重，从各属性组合中确定待查询属性组合；

记录模块，用于记录所述待查询属性组合的权重。

15.根据权利要求14所述的多维数据的处理装置，其特征在于，所述获取单元，还用于：

16.根据权利要求13所述的多维数据的处理装置，其特征在于，所述确定单元，还用于：

确定待固化属性组合的数量。

17.根据权利要求14所述的多维数据的处理装置，其特征在于，所述获取模块，还用于：

所述确定模块，还用于根据所述各属性组合对应的整体加权查询代价值，确定最小整体加权查询代价值；

所述确定模块，还用于确定所述最小整体加权查询代价值所对应的属性组合为待固化属性组合。

18.根据权利要求17所述的多维数据的处理装置，其特征在于，还包括：

判断单元，用于遍历所述属性组合集，判断所述属性组合集中是否有所述固化属性组合。

19.根据权利要求18所述的多维数据的处理装置，其特征在于，所述获取模块，包括：

选取子模块，用于在所述判断单元判断到所述属性组合集中没有所述固化属性组合，从所述属性组合集中选取一个属性组合；

获取子模块，用于获取所述属性组合上卷到各待查询属性组合的代价值；

确定子模块，用于根据所述属性组合上卷到各待查询属性组合的代价值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值；

求和子模块，用于将各加权查询代价值进行求和，获得该属性组合对应的整体加权查询代价值。

20.根据权利要求19所述的多维数据的处理装置，其特征在于，所述获取模块，还包括：

判断子模块，用于判断所述属性组合与待查询属性组合是否相同。

21.根据权利要求20所述的多维数据的处理装置，其特征在于，所述获取子模块，用于：

22.根据权利要求18所述的多维数据的处理装置，其特征在于，所述获取模块，包括：

选取子模块，用于在所述判断单元判断到所述属性组合集中有所述固化属性组合，提取各固化属性组合，并在各未固化属性组合中选取一个属性组合；所述未固化属性组合在所述属性组合集中；

获取子模块，用于获取各固化属性组合和所述属性组合上卷到一待查询属性组合的代价值；

确定子模块，用于确定所述上卷到一待查询属性组合的代价值的最小值；

所述确定子模块，还用于根据各待查询属性组合对应的所述最小值以及各待查询属性组合的权重，确定所述各待查询属性组合的加权查询代价值；

23.根据权利要求22所述的多维数据的处理装置，其特征在于，所述获取模块，还包括：

判断子模块，用于判断所述各固化属性组合和所述属性组合与待查询属性组合是否相同。

24.根据权利要求23所述的多维数据的处理装置，其特征在于，所述获取子模块，用于：