CN104484398B - 数据表中的数据聚合方法和装置 - Google Patents

数据表中的数据聚合方法和装置 Download PDF

Info

Publication number
CN104484398B
CN104484398B CN201410773623.2A CN201410773623A CN104484398B CN 104484398 B CN104484398 B CN 104484398B CN 201410773623 A CN201410773623 A CN 201410773623A CN 104484398 B CN104484398 B CN 104484398B
Authority
CN
China
Prior art keywords
set level
major key
dimension
index
level table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410773623.2A
Other languages
English (en)
Other versions
CN104484398A (zh
Inventor
廖小利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410773623.2A priority Critical patent/CN104484398B/zh
Publication of CN104484398A publication Critical patent/CN104484398A/zh
Application granted granted Critical
Publication of CN104484398B publication Critical patent/CN104484398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据表中的数据聚合方法和装置。该数据表中的数据聚合方法包括确定第一预设指标表和第二预设指标表;确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键;通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表;在关联数据表中确定第二预设指标表中的待聚合指标;统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表中的个数的比值。通过本发明,解决了现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题。

Description

数据表中的数据聚合方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据表中的数据聚合方法和装置。
背景技术
当数据库中待查询的数据来源于两个指标表,即指标表a和指标表b,且这两个指标表的外键关联的维度数量相差为1时,即指标表a中关联X个维度,指标表b中关联X-1个维度,如果对这两个指标表以相同的维度主键关联后,将会造成维度数量小的指标表b中的数据被扩大。如果对该数据库中的数据进行聚合运算将会造成聚合值被放大,严重影响数据库中数据聚合结果的准确性。
针对现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种数据表中的数据聚合方法和装置,以解决现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种数据表中的数据聚合方法。
该数据表中的数据聚合方法包括:确定第一预设指标表和第二预设指标表,其中,第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度;确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键;通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表;在关联数据表中确定第二预设指标表中的待聚合指标;统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表行数中的个数的比值。
进一步地,通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表包括:根据第一预设指标表确定关联数据表的行数,其中,关联数据表的行数与第一预设指标表的行数相同;根据第一预设指标表和待聚合指标的个数确定关联数据表的列数,其中,关联数据表的列数为第一预设指标表的列数与待聚合指标的个数的和;根据确定的关联数据表的行数和确定的关联数据表的列数得到关联数据表。
进一步地,统计第一维度主键对应的待聚合指标的聚合结果包括:获取第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数,其中,第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数等于第一维度主键在第一预设指标表中的个数;遍历关联数据表,对第一维度主键对应的待聚合指标进行求和,得到第一维度主键对应的待聚合指标的总和;计算第一维度主键对应的待聚合指标的总和与第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数的比值;将比值作为第一维度主键对应的待聚合指标的聚合结果。
进一步地,在将比值作为第一维度主键对应的待聚合指标的聚合结果之后,该数据表中的数据聚合方法还包括:获取第一预设指标表和第二预设指标表中多个相同的维度主键;将第一预设指标表和第二预设指标表中多个相同的维度主键存入预设数据表中;在预设数据表中遍历多个相同的维度主键中除第一维度主键之外的维度主键,分别按照每个维度主键将第一预设指标表和第二预设指标表进行关联,得到多个中间数据表;将多个中间数据表添加到关联数据表中。
进一步地,在将多个中间数据表添加到关联数据表中之后,该数据表中的数据聚合方法还包括:遍历关联数据表;分别统计关联数据表中不同维度主键对应的待聚合指标的聚合结果;输出关联数据表中不同维度主键对应的待聚合指标的聚合结果。
为了实现上述目的,根据本发明的另一方面,提供了一种数据表中的数据聚合装置。
该数据表中的数据聚合装置包括:第一确定模块,用于确定第一预设指标表和第二预设指标表,其中,第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度;第二确定模块,用于确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键;第一关联模块,用于通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表;第三确定模块,用于在关联数据表中确定第二预设指标表中的待聚合指标;第一统计模块,用于统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表行数中的个数的比值。
进一步地,第一关联模块包括:第一确定子模块,用于根据第一预设指标表确定关联数据表的行数,其中,关联数据表的行数与第一预设指标表的行数相同;第二确定子模块,用于根据第一预设指标表和待聚合指标的个数确定关联数据表的列数,其中,关联数据表的列数为第一预设指标表的列数与待聚合指标的个数的和;得到模块,用于根据确定的关联数据表的行数和确定的关联数据表的列数得到关联数据表。
进一步地,第一统计模块包括:第一获取模块,用于获取第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数,其中,第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数等于第一维度主键在第一预设指标表中的个数;第一计算模块,用于遍历关联数据表,对第一维度主键对应的待聚合指标进行求和,得到第一维度主键对应的待聚合指标的总和;第二计算模块,用于计算第一维度主键对应的待聚合指标的总和与第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数的比值;作为模块,用于将比值作为第一维度主键对应的待聚合指标的聚合结果。
进一步地,该数据表中的数据聚合装置还包括:第二获取模块,用于获取第一预设指标表和第二预设指标表中多个相同的维度主键;存储模块,用于将第一预设指标表和第二预设指标表中多个相同的维度主键存入预设数据表中;第二关联模块,用于在预设数据表中遍历多个相同的维度主键中除第一维度主键之外的维度主键,分别按照每个维度主键将第一预设指标表和第二预设指标表进行关联,得到多个中间数据表;添加模块,用于将多个中间数据表添加到关联数据表中。
进一步地,该数据表中的数据聚合装置还包括:遍历模块,用于遍历关联数据表;第二统计模块,用于分别统计关联数据表中不同维度主键对应的的待聚合指标的聚合结果;输出模块,用于输出关联数据表中不同维度主键对应的的待聚合指标的聚合结果。
通过本发明,采用确定第一预设指标表和第二预设指标表,其中,第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度;确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键;通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表;在关联数据表中确定第二预设指标表中的待聚合指标;统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表中的个数的比值,解决了现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题。该发明获取计算第一预设指标表和第二预设指标表以相同维度主键关联后得到的关联数据表,然后计算粗粒度指标表即第二预设指标表在关联数据表中重复出现的次数,在对关联数据表中的待聚合指标进行聚合计算时,将粗粒度指标表即第二预设指标表的待聚合指标除以粗粒度指标表即第二预设指标表在关联数据表中重复出现的次数,得到了准确的聚合结果,进而达到了保证聚合结果准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据表中的数据聚合方法的流程图;以及
图2是根据本发明实施例的数据表中的数据聚合装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明旨在提供一种数据表中的数据聚合方法和装置。
图1是根据本发明实施例的数据表中的数据聚合方法的流程图。如图1所示,该方法包括如下的步骤S101至步骤S105:
步骤S101,确定第一预设指标表和第二预设指标表。
优选地,该实施例的数据表中的数据聚合方法中的第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度。比如,第一预设指标表为指标表a,第二预设指标表为指标表b,其中,指标表a关联2个维度,分别为广告、项目,指标表a中的指标为点击量;指标表b关联1个维度,为广告,指标表b中的指标为订单量。指标表中的维度主键即为维度对应的值,指标表中每个维度的主键值可以有一个也可以由多个。比如,指标表a中的维度广告的主键包括广告1,广告2;指标表b中的维度广告的主键包括广告1和广告2。指标表a如表1所示,指标表b如表2所示。
表1 指标表a
广告 项目 点击量
1 2 5
1 3 10
1 5 15
2 2 4
2 3 6
表2 指标表b
广告 订单量
1 2
2 5
步骤S102,确定第一维度主键。
该实施例的数据表中的数据聚合方法中的第一维度主键为第一预设指标表和第二预设指标表共有的维度主键。比如,第一预设指标表为指标表a,第二预设指标表为指标表b,其中,指标表a关联2个维度,分别为广告、项目,指标表a中的指标为点击量;指标表b关联1个维度,为广告,指标表b中的指标为订单量。指标表中的维度主键即为维度对应的值,指标表a中的维度广告的主键包括广告1,广告2;指标表b中的维度广告的主键包括广告1和广告2,则可以确定第一维度主键为广告1或者广告2。
步骤S103,通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表。
优选地,该实施例的数据表中的数据聚合方法中通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表包括:根据第一预设指标表确定关联数据表的行数,其中,关联数据表的行数与第一预设指标表的行数相同;根据第一预设指标表和待聚合指标的个数确定关联数据表的列数,其中,关联数据表的列数为第一预设指标表的列数与待聚合指标的个数的和;根据确定的关联数据表的行数和确定的关联数据表的列数得到关联数据表。
比如,第一预设指标表为指标表a,第二预设指标表为指标表b,其中,指标表a关联2个维度,分别为广告、项目,指标表a中的指标为点击量;指标表b关联1个维度,为广告,指标表b中的指标为订单量。指标表中的维度主键即为维度对应的值,指标表a中的维度广告的主键包括广告1,广告2;指标表b中的维度广告的主键包括广告1和广告2,则第一维度主键为广告1或者广告2。以广告1和广告2关联指标表a和指标表b,得到关联数据表,如表3所示。
表3 关联数据表
广告 项目 点击量 订单量
1 2 5 2
1 3 10 2
1 5 15 2
2 2 4 5
2 3 6 5
步骤S104,在关联数据表中确定第二预设指标表中的待聚合指标。
在通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表之后,如表3所示。在关联数据表中确定待聚合指标,其中,待聚合指标可以是关联数据表中的指标中的任意一个,比如,将订单量作为待聚合指标。
步骤S105,统计待聚合指标的聚合结果。
优选地,该实施例的数据表中的数据聚合方法中的第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键对应的在第一预设指标表中的个数的比值。具体地,统计第一维度主键对应的待聚合指标的聚合结果可以包括:获取第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数,其中,第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数等于第一维度主键在第一预设指标表中的个数;遍历关联数据表,对第一维度主键对应的待聚合指标进行求和,得到第一维度主键对应的待聚合指标的总和;计算第一维度主键对应的待聚合指标的总和与第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数的比值;将比值作为第一维度主键对应的待聚合指标的聚合结果。该实施例的数据表中的数据聚合方法提高了关联数据表中数据聚合结果的准确度。
比如,如表3所示,在关联数据表中确定订单量为待聚合指标,广告1的订单量和总为6,广告1在指标表a中的个数为3,则广告1对应的订单量为2,广告2的订单量总和为10,广告2在指标表a中的个数为2,则广告2对应的订单量为5。
当第一预设指标表和第二预设指标表共有的关联主键有多个时,按照该实施例的数据表中的数据聚合方法可以分别按照共有的关联主键进行关联,得到多个关联数据表,从而实现对多个关联数据表中的数据进行聚合运算。优选地,在将比值作为第一维度主键对应的待聚合指标的聚合结果之后,该实施例的数据表中的数据聚合方法还包括:获取第一预设指标表和第二预设指标表中多个相同的维度主键;将第一预设指标表和第二预设指标表中多个相同的维度主键存入预设数据表中;在预设数据表中遍历多个相同的维度主键中除第一维度主键之外的维度主键,分别按照每个维度主键将第一预设指标表和第二预设指标表进行关联,得到多个中间数据表;将多个中间数据表添加到关联数据表中。
在将多个中间数据表添加到关联数据表中之后,该实施例的数据表中的数据聚合方法还包括:遍历关联数据表;分别统计关联数据表中不同维度主键对应的待聚合指标的聚合结果;输出关联数据表中不同维度主键对应的待聚合指标的聚合结果。其中,关联数据表中不同维度主键对应的待聚合指标的聚合结果可以以可视化的方式,比如图表,进行数据,便于数据分析指直观地进行统计分析。
该实施例的数据表中的数据聚合方法采用确定第一预设指标表和第二预设指标表,其中,第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度;确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键;通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表;在关联数据表中确定第二预设指标表中的待聚合指标;统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表中的个数的比值,解决了现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题,达到了提高数据表中数据聚合结果准确性的效果。
从以上的描述中,可以看出,本发明实施例的数据表中的数据聚合方法通过采用将具有相同维度主键,且所关联的维度相差为1的两个指标表进行关联,得到关联数据表。在计算关联数据表中待聚合指标的聚合结果时,将粗粒度指标表即维度数量较小的指标表中的待聚合指标除以粗粒度指标表在关联数据表中重复出现的次数,解决了现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题,达到了提高关联数据表中数据聚合结果的准确性的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例还提供了一种数据表中的数据聚合装置。需要说明的是,该数据表中的数据聚合装置可以用于执行本发明实施例的数据表中的数据聚合方法。
图2是根据本发明实施例的数据表中的数据聚合装置的示意图。如图2所示,该装置包括:第一确定模块10,第二确定模块20,第一关联模块30,第三确定模块40和第一统计模块50。
第一确定模块10,用于确定第一预设指标表和第二预设指标表,其中,第一预设指标表的维度与第二预设指标表的维度相差为1,且第一预设指标表的维度大于第二预设指标表的维度。
第二确定模块20,用于确定第一维度主键,其中,第一维度主键为第一预设指标表和第二预设指标表共有的维度主键。
第一关联模块30,用于通过第一维度主键将第一预设指标表和第二预设指标表进行关联,得到关联数据表。
优选地,第一关联模块30包括:第一确定子模块,用于根据第一预设指标表确定关联数据表的行数,其中,关联数据表的行数与第一预设指标表的行数相同;第二确定子模块,用于根据第一预设指标表和待聚合指标的个数确定关联数据表的列数,其中,关联数据表的列数为第一预设指标表的列数与待聚合指标的个数的和;得到模块,用于根据确定的关联数据表的行数和确定的关联数据表的列数得到关联数据表。
第三确定模块40,用于在关联数据表中确定第二预设指标表中的待聚合指标。
第一统计模块50,用于统计第一维度主键对应的待聚合指标的聚合结果,其中,第一维度主键对应的待聚合指标的聚合结果为关联数据表中第一维度主键对应的待聚合指标的总和与第一维度主键在第一预设指标表的个数的比值。
优选地,第一统计模块50包括:第一获取模块,用于获取第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数,其中,第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数等于第一维度主键在第一预设指标表的个数;第一计算模块,用于遍历关联数据表,对第一维度主键对应的待聚合指标进行求和,得到第一维度主键对应的待聚合指标的总和;第二计算模块,用于计算第一维度主键对应的待聚合指标的总和与第二预设指标表中第一维度主键对应的行在关联数据表中的重复次数的比值;作为模块,用于将比值作为第一维度主键对应的待聚合指标的聚合结果。
优选地,该实施例的数据表中的数据聚合装置还包括:第二获取模块,用于获取第一预设指标表和第二预设指标表中多个相同的维度主键;存储模块,用于将第一预设指标表和第二预设指标表中多个相同的维度主键存入预设数据表中;第二关联模块,用于在预设数据表中遍历多个相同的维度主键中除第一维度主键之外的维度主键,分别按照每个维度主键将第一预设指标表和第二预设指标表进行关联,得到多个中间数据表;添加模块,用于将多个中间数据表添加到关联数据表中。
优选地,该实施例的数据表中的数据聚合装置还包括:遍历模块,用于遍历关联数据表;第二统计模块,用于分别统计关联数据表中不同维度主键对应的待聚合指标的聚合结果;输出模块,用于输出关联数据表中不同维度主键对应的待聚合指标的聚合结果。
该实施例的数据表中的数据聚合装置包括第一确定模块10,第二确定模块20,第一关联模块30,第三确定模块40和第一统计模块50。通过该实施例的数据表中的数据聚合装置解决了现有技术对维度相差为1的两个指标表关联后的聚合计算结果不准确的问题。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据表中的数据聚合方法,其特征在于,包括:
确定第一预设指标表和第二预设指标表,其中,所述第一预设指标表的维度与所述第二预设指标表的维度相差为1,且所述第一预设指标表的维度大于所述第二预设指标表的维度;
确定第一维度主键,其中,所述第一维度主键为所述第一预设指标表和所述第二预设指标表共有的维度主键;
通过所述第一维度主键将所述第一预设指标表和所述第二预设指标表进行关联,得到关联数据表;
在所述关联数据表中确定所述第二预设指标表中的待聚合指标;以及
统计所述第一维度主键对应的所述待聚合指标的聚合结果,其中,所述第一维度主键对应的待聚合指标的聚合结果为所述关联数据表中所述第一维度主键对应的所述待聚合指标的总和与所述第一维度主键在所述第一预设指标表中的个数的比值。
2.根据权利要求1所述的数据表中的数据聚合方法,其特征在于,通过所述第一维度主键将所述第一预设指标表和所述第二预设指标表进行关联,得到关联数据表包括:
根据所述第一预设指标表确定所述关联数据表的行数,其中,所述关联数据表的行数与所述第一预设指标表的行数相同;
根据所述第一预设指标表和所述待聚合指标的个数确定所述关联数据表的列数,其中,所述关联数据表的列数为所述第一预设指标表的列数与所述待聚合指标的个数的和;以及
根据确定的所述关联数据表的行数和确定的所述关联数据表的列数得到所述关联数据表。
3.根据权利要求1所述的数据表中的数据聚合方法,其特征在于,统计所述第一维度主键对应的待聚合指标的聚合结果包括:
获取所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数,其中,所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数等于所述第一维度主键在所述第一预设指标表中的个数;
遍历所述关联数据表,对所述第一维度主键对应的所述待聚合指标进行求和,得到所述第一维度主键对应的所述待聚合指标的总和;
计算所述第一维度主键对应的所述待聚合指标的总和与所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数的比值;以及
将所述比值作为所述第一维度主键对应的所述待聚合指标的聚合结果。
4.根据权利要求3所述的数据表中的数据聚合方法,其特征在于,在将所述比值作为所述第一维度主键对应的所述待聚合指标的聚合结果之后,所述方法还包括:
获取所述第一预设指标表和所述第二预设指标表中多个相同的维度主键;
将所述第一预设指标表和所述第二预设指标表中多个相同的维度主键存入预设数据表中;
在所述预设数据表中遍历所述多个相同的维度主键中除所述第一维度主键之外的维度主键,分别按照每个维度主键将所述第一预设指标表和所述第二预设指标表进行关联,得到多个中间数据表;以及
将所述多个中间数据表添加到所述关联数据表中。
5.根据权利要求4所述的数据表中的数据聚合方法,其特征在于,在将所述多个中间数据表添加到所述关联数据表中之后,所述方法还包括:
遍历所述关联数据表;
分别统计所述关联数据表中不同维度主键对应的所述待聚合指标的聚合结果;以及
输出所述关联数据表中不同维度主键对应的所述待聚合指标的聚合结果。
6.一种数据表中的数据聚合装置,其特征在于,包括:
第一确定模块,用于确定第一预设指标表和第二预设指标表,其中,所述第一预设指标表的维度与所述第二预设指标表的维度相差为1,且所述第一预设指标表的维度大于所述第二预设指标表的维度;
第二确定模块,用于确定第一维度主键,其中,所述第一维度主键为所述第一预设指标表和所述第二预设指标表共有的维度主键;
第一关联模块,用于通过所述第一维度主键将所述第一预设指标表和所述第二预设指标表进行关联,得到关联数据表;
第三确定模块,用于在所述关联数据表中确定所述第二预设指标表中的待聚合指标;以及
第一统计模块,用于统计所述第一维度主键对应的所述待聚合指标的聚合结果,其中,所述第一维度主键对应的待聚合指标的聚合结果为所述关联数据表中所述第一维度主键对应的所述待聚合指标的总和与所述第一维度主键在所述第一预设指标表中的个数的比值。
7.根据权利要求6所述的数据表中的数据聚合装置,其特征在于,所述第一关联模块包括:
第一确定子模块,用于根据所述第一预设指标表确定所述关联数据表的行数,其中,所述关联数据表的行数与所述第一预设指标表的行数相同;
第二确定子模块,用于根据所述第一预设指标表和所述待聚合指标的个数确定所述关联数据表的列数,其中,所述关联数据表的列数为所述第一预设指标表的列数与所述待聚合指标的个数的和;以及
得到模块,用于根据确定的所述关联数据表的行数和确定的所述关联数据表的列数得到所述关联数据表。
8.根据权利要求6所述的数据表中的数据聚合装置,其特征在于,所述第一统计模块包括:
第一获取模块,用于获取所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数,其中,所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数等于所述第一维度主键在所述第一预设指标表中的个数;
第一计算模块,用于遍历所述关联数据表,对所述第一维度主键对应的所述待聚合指标进行求和,得到所述第一维度主键对应的所述待聚合指标的总和;
第二计算模块,用于计算所述第一维度主键对应的待聚合指标的总和与所述第二预设指标表中所述第一维度主键对应的行在所述关联数据表中的重复次数的比值;以及
作为模块,用于将所述比值作为所述第一维度主键对应的所述待聚合指标的聚合结果。
9.根据权利要求8所述的数据表中的数据聚合装置,其特征在于,所述装置还包括:
第二获取模块,用于获取所述第一预设指标表和所述第二预设指标表中多个相同的维度主键;
存储模块,用于将所述第一预设指标表和所述第二预设指标表中多个相同的维度主键存入预设数据表中;
第二关联模块,用于在所述预设数据表中遍历所述多个相同的维度主键中除所述第一维度主键之外的维度主键,分别按照每个维度主键将所述第一预设指标表和所述第二预设指标表进行关联,得到多个中间数据表;以及
添加模块,用于将所述多个中间数据表添加到所述关联数据表中。
10.根据权利要求9所述的数据表中的数据聚合装置,其特征在于,所述装置还包括:
遍历模块,用于遍历所述关联数据表;
第二统计模块,用于分别统计所述关联数据表中不同维度主键对应的所述待聚合指标的聚合结果;以及
输出模块,用于输出所述关联数据表中不同维度主键对应的所述待聚合指标的聚合结果。
CN201410773623.2A 2014-12-12 2014-12-12 数据表中的数据聚合方法和装置 Active CN104484398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410773623.2A CN104484398B (zh) 2014-12-12 2014-12-12 数据表中的数据聚合方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410773623.2A CN104484398B (zh) 2014-12-12 2014-12-12 数据表中的数据聚合方法和装置

Publications (2)

Publication Number Publication Date
CN104484398A CN104484398A (zh) 2015-04-01
CN104484398B true CN104484398B (zh) 2018-02-02

Family

ID=52758939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410773623.2A Active CN104484398B (zh) 2014-12-12 2014-12-12 数据表中的数据聚合方法和装置

Country Status (1)

Country Link
CN (1) CN104484398B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326243B (zh) * 2015-06-19 2020-02-21 苏宁云计算有限公司 一种数据处理方法及装置
CN105279269B (zh) * 2015-10-27 2018-08-28 中通服公众信息产业股份有限公司 一种支持表自由关联的sql生成方法和系统
CN106933902B (zh) * 2015-12-31 2020-02-07 北京国双科技有限公司 数据多维度自由剖析的查询方法及装置
CN108268523B (zh) * 2016-12-30 2021-06-22 北京国双科技有限公司 数据库聚合处理方法及装置
CN110147352A (zh) * 2017-09-29 2019-08-20 北京国双科技有限公司 一种数据处理方法和装置
CN110955654B (zh) * 2018-09-26 2023-10-31 北京国双科技有限公司 多维度的指标计算方法及装置
CN110347688B (zh) * 2019-07-10 2020-09-11 星环信息科技(上海)有限公司 多元信息的特征融合方法、装置、设备及存储介质
CN113760888B (zh) * 2020-11-09 2023-09-01 北京京东振世信息技术有限公司 一种生成数据表的方法、装置和存储介质
CN117150348A (zh) * 2023-10-30 2023-12-01 宁德时代新能源科技股份有限公司 电池外损数据处理方法、系统、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500165A (zh) * 2013-08-21 2014-01-08 新华通讯社 一种结合聚类和双key值的高维向量检索方法
CN104050162A (zh) * 2013-03-11 2014-09-17 富士通株式会社 数据处理方法和数据处理装置
CN104166739A (zh) * 2014-09-05 2014-11-26 北京国双科技有限公司 分析数据库的指标文件处理方法及装置
CN104182544A (zh) * 2014-09-05 2014-12-03 北京国双科技有限公司 分析数据库的维度剖析方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7415719B2 (en) * 2003-09-26 2008-08-19 Tizor Systems, Inc. Policy specification framework for insider intrusions
US7487172B2 (en) * 2006-01-20 2009-02-03 International Business Machines Corporation Three-dimensional data structure for storing data of multiple domains and the management thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050162A (zh) * 2013-03-11 2014-09-17 富士通株式会社 数据处理方法和数据处理装置
CN103500165A (zh) * 2013-08-21 2014-01-08 新华通讯社 一种结合聚类和双key值的高维向量检索方法
CN104166739A (zh) * 2014-09-05 2014-11-26 北京国双科技有限公司 分析数据库的指标文件处理方法及装置
CN104182544A (zh) * 2014-09-05 2014-12-03 北京国双科技有限公司 分析数据库的维度剖析方法及装置

Also Published As

Publication number Publication date
CN104484398A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN104484398B (zh) 数据表中的数据聚合方法和装置
CN104408179B (zh) 数据表中数据处理方法和装置
CN107784426A (zh) 一种员工的岗位分配方法、装置及设备
CN107704625A (zh) 字段匹配方法和装置
CN109034244A (zh) 基于电量曲线特征模型的线损异常诊断方法及装置
CN105471637B (zh) 一种复杂网络节点重要性评估方法及系统
CN107992595A (zh) 一种学习内容推荐方法、装置及智能设备
CN109300310A (zh) 一种车流量预测方法及装置
CN104392001B (zh) 数据库查询方法和装置
CN104572587B (zh) 数据矩阵相乘的加速运算方法和装置
CN104462443B (zh) 数据处理方法和装置
CN107291874A (zh) 地图点位聚合方法及装置
CN110058299A (zh) 地震定位方法、装置及终端设备
CN106325756A (zh) 一种数据存储、数据计算方法和设备
CN109118095A (zh) 基于机器学习的动态火灾风险评估方法、装置及服务器
CN104182544B (zh) 分析数据库的维度剖析方法及装置
CN107391351A (zh) 一种计算机设备健康状态评估方法
CN109699002A (zh) 一种室内WiFi定位方法、装置及终端设备
CN109684311A (zh) 异常数据检测方法及装置
CN107968987A (zh) 基于定积分结合环境参数的rssi加权质心定位方法
CN109344302A (zh) 一种组织架构信息的展示方法、存储介质和服务器
CN108108488A (zh) 基于流式计算的数据统计分析方法及系统、计算机程序
CN104268293B (zh) 数据库中的不可累加指标处理方法和装置
CN105043377B (zh) 一种跑步路线记录方法、装置、以及一种电子设备
CN110347698A (zh) 报表数据处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for aggregation of data in datasheet

Effective date of registration: 20190531

Granted publication date: 20180202

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.