CN108614818A - 一种数据存储、更新和查询方法及装置 - Google Patents

一种数据存储、更新和查询方法及装置 Download PDF

Info

Publication number
CN108614818A
CN108614818A CN201611127382.XA CN201611127382A CN108614818A CN 108614818 A CN108614818 A CN 108614818A CN 201611127382 A CN201611127382 A CN 201611127382A CN 108614818 A CN108614818 A CN 108614818A
Authority
CN
China
Prior art keywords
cube
data
data sub
information
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611127382.XA
Other languages
English (en)
Other versions
CN108614818B (zh
Inventor
陈国栋
管国辰
郭峰
席大超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201611127382.XA priority Critical patent/CN108614818B/zh
Publication of CN108614818A publication Critical patent/CN108614818A/zh
Application granted granted Critical
Publication of CN108614818B publication Critical patent/CN108614818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据存储、更新和查询方法及装置,该数据存储方法中,构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体;判断当前层的数据子立方体是否满足预设合并条件;如果满足,根据第一预设合并规则,将当前层的数据子立方体合并为上一层数据子立方体;判断上一层数据子立方体是否满足预设合并条件;如果满足,将上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将当前层的数据子立方体合并为上一层数据子立方体的步骤;如果不满足,保存所构建的多层数据子立方体。通过更新历史数据对应的数据子立方体实现对已存储的历史数据进行更新。

Description

一种数据存储、更新和查询方法及装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据存储、更新和查询方法及装置。
背景技术
在今天的大数据时代,对数据进行处理尤其重要,目前存在多种数据处理方法,而OLAP(Online Analytical Processing,在线联机分析处理)是较为常用的一种提供决策服务的数据处理方法,常被应用于不同的大数据平台。
其中,MOLAP(Multidimension Online Analytical Processing,多维联机分析处理)是OLAP进行数据处理的主要方式,由于MOLAP只用于存储历史数据,导致在历史数据出现变化时,MOLAP无法对历史数据进行更新。
因此,基于现有的数据存储方法,无法对已存储的历史数据进行更新。
发明内容
本发明实施例的目的在于提供一种数据存储、更新和查询方法及装置,以实现对已存储的历史数据进行更新。具体技术方案如下:
一种数据存储方法,应用于服务器,所述方法包括:
构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;
判断所述当前层的数据子立方体是否满足预设合并条件;
如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;
判断所述上一层数据子立方体是否满足所述预设合并条件;
如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;
如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
可选的,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述构建多个数据子立方体的步骤,包括:
针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性;
根据所述第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及所述第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息;
根据第二预设合并规则,将所述第一标识信息及所述第二标识信息合并为键值;
根据该条信息中包含的数据,确定每个键值对应的数据,并将所述键值与所述数据的对应关系作为数据子立方体。
可选的,所述方法还包括:
判断事实表中是否存在新信息,如果存在,再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条新信息,并执行所述判断所述当前层的数据子立方体是否满足预设合并条件的步骤。
可选的,所述预设合并条件为数据子立方体的数量达到预设数量值。
一种数据更新方法,应用于服务器,所述方法包括:
获得事实表中记录的待更新信息;
在预先保存的各层数据子立方体中,确定与所述待更新信息对应的待更新数据子立方体;
根据所述待更新信息对所述待更新数据子立方体进行数据更新;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;判断所述当前层的数据子立方体是否满足预设合并条件;如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;判断所述上一层数据子立方体是否满足所述预设合并条件;如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
可选的,所述根据所述待更新信息对所述待更新数据子立方体进行数据更新的步骤,包括:
确定所述待更新信息的数据量;
判断所述待更新信息的数据量是否大于预设阈值;
如果大于预设阈值,保存所述待更新信息,并在预设时间段内通过所保存的待更新信息对所述待更新数据子立方体进行数据更新;
如果未大于预设阈值,立即通过所述待更新信息对所述待更新数据子立方体进行数据更新。
一种数据查询方法,应用于服务器,所述方法包括:
接收数据查询请求,所述数据查询请求包括至少一个关键词;
根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值;
基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息且每个数据子立方体中包含键值与数据的对应关系;判断所述当前层的数据子立方体是否满足预设合并条件;如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;判断所述上一层数据子立方体是否满足所述预设合并条件;如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
可选的,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值的步骤,包括:
确定各关键词的维度属性,并根据所述第一预设对应关系及所述第二预设对应关系,确定所述各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
根据第三预设合并规则,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
可选的,所述根据第三预设合并规则,将所述第三标识信息及第四标识信息合并为至少一个目标键值的步骤,包括:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
可选的,所述基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据的步骤,包括:
确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询所述使用状态为可用的数据子立方体,获取与所述目标键值对应的数据;
根据第四预设合并规则,将获得的数据合并为目标数据。
一种数据存储装置,应用于服务器,所述装置包括:
构建模块,用于构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;
第一判断模块,用于判断所述当前层的数据子立方体是否满足预设合并条件,如果是,触发合并模块;
所述合并模块,用于根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;
第二判断模块,用于判断所述上一层数据子立方体是否满足所述预设合并条件,如果是,触发确定模块,如果否,触发保存模块;
所述确定模块,用于将所述上一层数据子立方体作为当前层的数据子立方体,再触发所述合并模块;
所述保存模块,用于保存所构建的多层数据子立方体。
可选的,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述构建模块,具体用于:
针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性;
根据所述第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及所述第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息;
根据第二预设合并规则,将所述第一标识信息及所述第二标识信息合并为键值;
根据该条信息中包含的数据,确定每个键值对应的数据,并将所述键值与所述数据的对应关系作为数据子立方体。
可选的,所述装置还包括:
第三判断模块,用于判断事实表中是否存在新信息,如果是,触发再构建模块;
所述再构建模块,用于再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条新信息,并触发所述第一判断模块。
可选的,所述预设合并条件为数据子立方体的数量达到预设数量值。
一种数据更新装置,应用于服务器,所述装置包括:
获得模块,用于获得事实表中记录的待更新信息;
待更新数据子立方体确定模块,用于在预先保存的各层数据子立方体中,确定与所述待更新信息对应的待更新数据子立方体;
更新模块,用于根据所述待更新信息对所述待更新数据子立方体进行数据更新;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
可选的,所述更新模块,包括:
数据量确定单元,用于确定所述待更新信息的数据量;
判断单元,用于判断所述待更新信息的数据量是否大于预设阈值,如果是,触发第一更新单元,如果否,触发第二更新单元;
所述第一更新单元,用于保存所述待更新信息,并在预设时间段内通过所保存的待更新信息对所述待更新数据子立方体进行数据更新;
所述第二更新单元,用于立即通过所述待更新信息对所述待更新数据子立方体进行数据更新。
一种数据查询装置,应用于服务器,所述装置包括:
接收模块,用于接收数据查询请求,所述数据查询请求包括至少一个关键词;
目标键值确定模块,用于根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值;
目标数据获取模块,用于基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时;根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
可选的,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述目标键值确定模块,包括:
标识信息确定单元,用于确定各关键词的维度属性,并根据所述第一预设对应关系及所述第二预设对应关系,确定所述各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
目标键值合并单元,用于根据第三预设合并规则,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
可选的,所述目标键值合并单元,具体用于:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
可选的,所述目标数据获取模块,包括:
可用数据子立方体确定单元,用于确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询单元,用于查询所述使用状态为可用的数据子立方体,获取与所述目标键值对应的数据;
目标数据合并单元,用于根据第四预设合并规则,将获得的数据合并为目标数据。
本发明实施例中,一层一层的构建数据子立方体,形成树形层级结构的数据子立方体,由此,通过构建事实表中的每条信息对应的数据子立方体的方式进行历史数据的存储,在对已存储的历史数据进行更新时,更新历史数据对应的数据子立方体即可,可见通过本发明实施例提供的数据存储方法,可以实现对已存储的历史数据进行更新。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据存储方法的第一种流程示意图;
图2为本发明实施例提供的构建一条信息对应的数据子立方体的流程示意图;
图3为本发明实施例提供的多层数据子立方体的结构示意图;
图4为本发明实施例提供的数据存储方法的第二种流程示意图;
图5为本发明实施例提供的一种数据更新方法的流程示意图;
图6为本发明实施例提供的一种数据查询方法的流程示意图;
图7为本发明实施例提供的一种数据存储装置的结构示意图;
图8为本发明实施例提供的一种数据更新装置的结构示意图;
图9为本发明实施例提供的一种数据查询装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术问题,本发明实施例提供了一种数据存储、更新和查询方法及装置。
下面首先对本发明实施例所提供的一种数据存储方法进行介绍。
如图1所示,本发明实施例提供的一种数据存储方法,应用于服务器,可以包括:
S101:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体。
由于事实表中一般记录有多条信息,以水果销售事实表为例,事实表中的一条信息可以为一个小时内卖出的1000单苹果,又由于时间属性一般为数据存储的基本属性,因此,本发明实施例可以以事实表中的一条信息对应的最小时间为构建数据子立方体的标准,当然,并不局限于此,也可以以事实表中的一条信息对应的最小地区或最小类别等为构建数据子立方体的标准。
例如:针对事实表中记录的一条2016年11月23日1点水果销售的第一信息,该条信息对应的时间从大到小分别为:年、月、日和小时,则可以以该条信息的最小时间1点为构建该条信息对应的数据子立方体的标准,构建2016年11月23日1点对应的第一数据子立方体;针对事实表中记录的一条2016年11月23日2点水果销售的第二信息,可以以该条信息的最小时间2点为构建该条信息对应的数据子立方体的标准,构建2016年11月23日2点对应的第二数据子立方体。
由此,本发明实施例针对事实表中记录的每条信息构建其对应的数据子立方体,即每个数据子立方体对应事实表中记录的一条信息。
其中,服务器中预先存储有第一预设对应关系和第二预设对应关系,第一预设对应关系为维度属性与标识信息的对应关系,第二预设对应关系为关键词与标识信息的对应关系,上述构建多个数据子立方体的步骤,可以包括:
如图2所示,针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
S1011:针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性。
例如:针对事实表中记录的如下表一条2016年6月13日1点水果销售的第一信息:
可以识别该条信息中每个维度属性,即分别为:水果种类、等级和产地。
S1012:根据第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息。
确定维度属性后,可以根据第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息。
如,上述事实表中各维度属性对应的第一标识信息可以为:
水果种类:a 等级:b 产地:c
并且,确定维度属性后,还可以确定每个维度属性对应的关键词。如,上述事实表中,每个维度属性对应的关键词分别为:
然后根据第二预设对应关系,可以确定每个维度属性中包括的每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息。
如,上述事实表中每个关键词对应的第二标识信息可以为:
S1013:根据第二预设合并规则,将第一标识信息及第二标识信息合并为键值。
得到事实表中每个维度属性对应的第一标识信息及每个关键词对应的第二标识信息后,可以根据第二预设合并规则,将第一标识信息及第二标识信息合并,确定该条信息对应的键值。具体地,可以基于预先设定的键值中出现的标识信息及各标识信息的位置等,得到对应的键值。
例如,对上述事实表中出现的第一标识信息以及第二标识信息进行合并后,可以得到下列键值:a-1-0-0、a-2-0-0、b-0-1-0、b-0-2-0、c-0-0-1、c-0-0-2、ab-1-1-0、ab-1-2-0、ab-2-1-0、ac-1-0-1、ac-1-0-2、ac-2-0-2、bc-0-1-1、bc-0-1-2、bc-0-2-2、abc-1-1-1、abc-1-2-2、abc-2-1-2。
其中,上述各键值含义解释如下表:
键值 含义解释 键值 含义解释
a-1-0-0 所有苹果总数 ac-1-0-1 杭州苹果总数
a-2-0-0 所有橘子总数 ac-1-0-2 上海苹果总数
b-0-1-0 A等级水果总数 ac-2-0-2 上海橘子总数
b-0-2-0 B等级水果总数 bc-0-1-1 杭州A等级水果总数
c-0-0-1 杭州水果总数 bc-0-1-2 上海A等级水果总数
c-0-0-2 上海水果总数 bc-0-2-2 上海B等级水果总数
ab-1-1-0 A等级苹果总数 abc-1-1-1 杭州A等级苹果总数
ab-1-2-0 B等级苹果总数 abc-1-2-2 上海B等级苹果总数
ab-2-1-0 A等级橘子总数 abc-2-1-2 上海A等级橘子总数
S1014:根据该条信息中包含的数据,确定每个键值对应的数据,并将键值与数据的对应关系作为数据子立方体。
得到各键值后,可以根据事实表中记录的数据,确定每个键值对应的数据。例如,根据键值的含义,可以对事实表中的数据进行求和、求平均等处理,得到键值对应的数据。并将各键值与数据的对应关系保存为数据子立方体。
详细的,在将各键值及对应的数据保存为数据子立方体时,可以按照预设的顺序将各键值进行保存。如,当标识信息中包括字母时,可以按照字母顺序将每个键值及其对应的数据进行保存;当标识信息中包括数字时,可以按照数字大小顺序将每个键值及其对应的数据进行保存。
例如,针对上述事实表,可以得到如下所示的数据子立方体:
键值 数量 键值 数量
a-1-0-0 800 ac-1-0-1 500
a-2-0-0 200 ac-1-0-2 300
b-0-1-0 700 ac-2-0-2 200
b-0-2-0 300 bc-0-1-1 500
c-0-0-1 500 bc-0-1-2 200
c-0-0-2 500 bc-0-2-2 300
ab-1-1-0 500 abc-1-1-1 500
ab-1-2-0 300 abc-1-2-2 300
ab-2-1-0 200 abc-2-1-2 200
在构建了多个数据子立方体后,将所构建的多个数据子立方体作为当前层的数据子立方体,例如:事实表中存在两条信息,第一条信息为2016年11月23日1点对应的信息,第二条信息为2016年11月23日2点对应的信息,则构建第一条信息对应的第一数据子立方体和第二条信息对应的第二数据子立方体,并将第一数据子立方体和第二数据子立方体作为当前层的数据子立方体,且,当前层的数据子立方体的分层粒度为小时。
S102:判断当前层的数据子立方体是否满足预设合并条件,如果是,执行步骤S103,如果否,不做处理。
在确定当前层的数据子立方体后,判断当前层的数据子立方体是否满足预设合并条件,其中,该预设合并条件可以为数据子立方体的数量达到预设数量值,该预设数量值可以与所判断的数据子立方体所在层的分层粒度匹配,由于当前层的数据子立方体的分层粒度为小时,则该预设数据量可以为24,当前层存在24个小时对应的24个数据子立方体即为满足预设合并条件则;或者该预设数据量可以为1个以上,即当前层存在超过1个小时对应的数据子立方体即为满足预设合并条件。
S103:根据第一预设合并规则,将当前层的数据子立方体合并为当前层的上一层数据子立方体。
在所在层的数据子立方体满足预设合并条件时,根据第一预设合并规则,将当前层的数据子立方体合并为当前层的上一层数据子立方体,以预设合并条件中的预设数据量为24,当前层存在24个小时对应的24个数据子立方体为例,则根据第一预设合并规则,将24个当前层的数据子立方体合并为上一层数据子立方体,即合并为2016年11月23日对应的上一层数据子立方体,且,上一层的数据子立方体的分层粒度为日。
S104:判断上一层数据子立方体是否满足预设合并条件,如果是,执行步骤S105,如果否,执行步骤S106。
在确定上一层的数据子立方体后,判断上一层数据子立方体是否满足预设合并条件,其中,该预设合并条件可以为数据子立方体的数量达到预设数量值,该预设数量值与所判断的数据子立方体所在层的分层粒度匹配,由于上一层数据子立方体的分层粒度为日且时间为11月,则该预设数据量可以为30,上一层存在30天对应的30个数据子立方体即为满足预设合并条件;或者,该预设数量可以为1个以上,即上一层存在超过1天对应的数据子立方体即为满足预设合并条件。
S105:将上一层数据子立方体作为当前层的数据子立方体,再执行步骤S103。
在确定上一层数据子立方体满足预设合并条件时,将上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将当前层的数据子立方体合并为当前层的上一层数据子立方体,且上一层的数据子立方体的分层粒度为月。
S106:保存所构建的多层数据子立方体。
如图3所示,在确定上一层数据子立方体不满足预设合并条件时,保存所构建的多层数据子立方体,图3中虚线框表示尚未构建的数据子立方体,实线框表示已构建的数据子立方体,由图可见,在每一层均满足预设合并条件时,可由分层粒度为小时的子立方体合并为上一层的分层粒度为天的子立方体,再由分层粒度为天的子立方体合并为上一层的分层粒度为月的子立方体,由此依次向上合并,直到合并为分层粒度为年的子立方体。
详细的,可以通过Hbase(Hadoop Database,分布式存储数据库)保存所构建的多层数据子立方体,将全部数据子立方体保存到一张Hbase表中。
具体的,指定时间范围对应的id为:
2015/1/1-2015/12/31(id:00)、2016/1/1-2016/12/31(id:01);
指定维度空间对应的id为:1维(id:01)、2维(id:02)、3维(id:03)、4维(id:04);
指定维度对应的id为:种类(id:00)、产地(id:01)、日期(id:02)、等级(id:03);
指定日期对应的id为:年(id:Y)、月(id:M)、日(id:D)、小时(id:H);
指定键值及日期对应的id为:种类-日期(id:0002),等级-日期(id:0302),种类-日期(id:0102),种类-等级-日期(id:000302),种类-产地-日期(id:000102),等级-产地-日期(id:030102),种类-等级-产地-日期(id:00030102);
则将全部数据子立方体保存到一张Hbase表中可以为:
由此,将全部数据子立方体保存到一张Hbase表中,减少了数据存储的存储空间。
本发明实施例中,一层一层的构建数据子立方体,形成树形层级结构的数据子立方体,由此,通过构建事实表中的每条信息对应的数据子立方体的方式进行历史数据的存储,在对已存储的历史数据进行更新时,更新历史数据对应的数据子立方体即可,可见通过本发明实施例提供的数据存储方法,可以实现对已存储的历史数据进行更新。
在图1所示方法的基础上,如图4所示,本发明实施例所提供的一种数据存储方法还可以包括:
S107:判断事实表中是否存在新信息,如果是,执行步骤S108。
在构建了多层数据子立方体后,可以按照预定的时间间隔判断事实表中是否存在新信息,例如:构建了2016年6月13日之前的多层数据子立方体,当判断事实表中存在2016年6月14日的信息时,需要构建2016年6月14日对应的多个数据子立方体以保存2016年6月14日的数据。
S108:再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,并执行步骤S102。
在判断事实表中存在新信息时,再构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,再继续判断当前层的数据子立方体是否满足预设合并条件,其中,每个数据子立方体对应事实表中记录的一条新信息。
另外,在再构建多个数据子立方体之前,可以确定新信息的数据量,并判断新信息的数据量是否大于预设信息量阈值;
如果大于预设信息量阈值,保存该新信息,并在第一预设时间段内再构建多个数据子立方体;
如果未大于预设信息量阈值,立即再构建多个数据子立方体。
其中,该第一预设时间段可以为计算机运行的空闲时间段,例如:24:00-6:00。
由此,在新信息的数量较小时,立即再构建新信息对应的数据子立方体,完成数据存储;在新信息的数量较大时,不立即执行构建数据子立方体的操作,在第一预设时间段内再构建新信息对应的数据子立方体,可以有足够的内存用于构建新信息对应的数据子立方体。
由此,通过判断事实表中是否存在新信息的方式,构建新信息对应的数据子立方体,完成了对新信息的数据存储。
如图5所示,本发明实施例提供的一种数据更新方法,应用于服务器,所述方法可以包括:
S201:获得事实表中记录的待更新信息。
在构建了多层数据子立方体后,可以按照预定的时间间隔判断事实表中是否存在待更新信息,例如:构建了2016年6月13日之前的多层数据子立方体,当需要对已构建的2016年6月13日之前的多层数据子立方体进行更新时即判断事实表中记录有待更新信息时,则获得事实表中记录的待更新信息。
S202:在预先保存的各层数据子立方体中,确定与待更新信息对应的待更新数据子立方体。
在获得事实表中记录的待更新信息后,需要确定预先保存的各层数据子立方体中与该待更新信息对应的待更新数据子立方体,例如:假设已构建2016年6月13日24点之前的多层数据子立方体,假设事实表中记录的待更新信息为2016年6月12日3点的信息,则在已构建的多层数据子立方体中找到2016年6月12日3点对应的数据子立方体A,将该数据子立方体A确定为与2016年6月12日3点的待更新信息对应的待更新数据子立方体。
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;判断所述当前层的数据子立方体是否满足预设合并条件;如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;判断所述上一层数据子立方体是否满足所述预设合并条件;如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
S203:根据待更新信息对待更新数据子立方体进行数据更新。
在确定待更新数据子立方体后,即可通过待更新信息对待更新数据子立方体进行数据更新,其中,上述根据待更新信息对待更新数据子立方体进行数据更新的步骤,可以包括:
确定待更新信息的数据量;
判断待更新信息的数据量是否大于预设阈值;
如果大于预设阈值,保存待更新信息,并在预设时间段内通过所保存的待更新信息对待更新数据子立方体进行数据更新;
如果未大于预设阈值,立即通过待更新信息对待更新数据子立方体进行数据更新。
其中,该预设时间段可以为计算机运行的空闲时间段,例如:24:00-6:00。
由此,在待更新信息的数量较小时,立即对待更新数据子立方体进行数据更新;在待更新信息的数量较大时,不立即进行数据更新,在预设时间段内对待更新数据子立方体进行数据更新,可以有足够的内存用于构建新信息对应的数据子立方体。
由于本发明实施例中构建了事实表中各条信息对应的数据子立方体,因此,在更新数据时,只需更新待更新数据对应的数据子立方体即可,无需对所有数据进行更新,减少了更新数据的耗时。
另外,在已构建的数据子立方体中涉及最大值和最小值时,一般只保存一个最大值和最小值,例如:保存了2016年6月13日杭州A等级苹果总数的最大值1700和2016年6月13日上海A等级苹果总数最小值300,当删除了该最大值时或最小值时,由于只保存了一个最大值和最小值,只有通过重新构建该数据子立方体才可获知除1700以外的最大值或者除300以外的最小值。
因此,本发明实施例为了避免该情况的发生,在构建数据子立方体时,可以将各个键值对应的数据按照从大到小的顺序排列,保存最大值及最大值之后预设位数个数据,保存最小值及最小值之前预设位数个数据,由此,在删除一个最大值或最小值的情况下,无需重新构建该数据子立方体,即可直接获得新的最大值或者新的最小值。
例如:预设位数为2位,数据子立方体中保存了最大值及最大值之后2个数据分别为1700、1500、1300,保存了最小值及最小值之前2个数据分别为500、400、300,则在删除了1700后,可以直接获得新的最大值1500,或者,在删除了300后,可以直接获得新的最小值400。
如图6所示,本发明实施例提供的一种数据查询方法,应用于服务器,所述方法包括:
S301:接收数据查询请求,该数据查询请求包括至少一个关键词。
当用户需要获取数据时,可以基于自己想要的数据,输入包括至少一个关键词的数据查询请求,服务器接收该数据查询请求。
S302:根据该至少一个关键词,得到数据查询请求对应的至少一个目标键值。
由于通常情况下,事实表中会包括多个维度数据,每个维度属性又对应多个关键词,因此,服务器中可以预先存储有第一预设对应关系和第二预设对应关系,第一预设对应关系为维度属性与标识信息的对应关系,第二预设对应关系为关键词与标识信息的对应关系;
上述根据至少一个关键词,得到数据查询请求对应的至少一个目标键值的步骤,可以包括:
确定各关键词的维度属性,并根据第一预设对应关系及第二预设对应关系,确定各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
根据第三预设合并规则,将第三标识信息及第四标识信息合并为至少一个目标键值。
例如:当数据获取请求中包括的关键词为:苹果、A等级和杭州时,针对上述数据获取请求,服务器可以分别确定各关键词的维度属性为:水果种类、等级和产地。
确定各关键词的维度属性后,可以根据第一预设对应关系以及第二预设对应关系,确定数据获取请求中各关键词对应的第三标识信息及各关键词的维度属性对应的第四标识信息。如下表所示:第一预设对应关系以及第二预设对应关系。
根据上述表格,确定的各关键词对应的第三标识信息分别为:苹果-1、A等级-1和杭州-1,各关键词的维度属性对应的第四标识信息为:水果种类-a、等级-b、产地-c。
确定数据获取请求中各关键词对应的第三标识信息以及各关键词的维度属性对应的第四标识信息后,可以根据第三预设合并规则,将第三标识信息及第四标识信息合并,得到数据获取请求对应的至少一个目标键值。
上述根据第三预设合并规则,将第三标识信息及第四标识信息合并为至少一个目标键值的步骤,可以包括:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
在本实施例的一个可选实现方式中,在得到目标键值之前,可以首先判断关键词之间的关系。每两个关键词之间的关系可以包括:与、或。当关键词之间的关系不同时,可以利用不同的方法得到目标键值。
具体地,如果两个关键词之间是与的关系时,根据该两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州之间均是与的关系时,根据各关键词对应的维度属性:水果种类、等级、产地,各维度属性的排列顺序以及每个标识信息对应的位置,可以确定这3个关键词对应的目标键值为:abc-1-1-1。
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州均为或的关系,则针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,可以确定这3各关键词分别对应的目标键值为:a-1-0-0、b-0-1-0、c-0-0-1。
S303:基于目标键值,遍历预先保存的各层数据子立方体,获取目标数据。
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息且每个数据子立方体中包含键值与数据的对应关系;判断当前层的数据子立方体是否满足预设合并条件;如果满足预设合并条件,根据第一预设合并规则,将当前层的数据子立方体合并为当前层的上一层数据子立方体;判断上一层数据子立方体是否满足预设合并条件;如果满足预设合并条件,将上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足预设合并条件,保存所构建的多层数据子立方体。
得到目标键值后,服务器可以基于该目标键值,从预先保存的包含有各键值与各数据对应关系的各层数据子立方体中,获取与数据获取请求匹配的目标数据。
上述基于目标键值,遍历预先保存的各层数据子立方体,获取目标数据的步骤,可以包括:
确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询使用状态为可用的数据子立方体,获取与目标键值对应的数据;
根据第四预设合并规则,将获得的数据合并为目标数据。
由于在接收到数据查询请求时,会存在以下多种情况:
第一种情况:有些数据子立方体执行更新操作;
有些数据子立方体正在进行数据更新或将在预设时间段内进行数据更新,此时,无法执行对该类数据子立方体的查询操作,只有经过数据更新后,才可对该类数据子立方体进行查询操作。
第二种情况:有些数据子立方体执行构建操作;
有些数据子立方体尚未构建完成,此时,无法执行对该类数据子立方体的查询操作,只有在构建完成后,才可对该类数据子立方体进行查询操作。
因此,为了获取目标数据,确定所遍历的各层数据子立方体中可执行被查询操作的数据子立方体,即确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体,查询使用状态为可用的数据子立方体,获取与目标键值对应的数据,在遍历结束后,根据第四预设合并规则,将遍历获得的数据合并为目标数据。
另外,针对于不可被执行查询操作的数据子立方体,即使用状态为不可用的数据子立方体,判断是否可以查询索引,如果是,查询索引获取与数据查询请求匹配的数据,并将查询索引获取的数据与获取的与目标键值对应的数据合并为目标数据,如果否,查询原始表获取与数据查询请求匹配的数据,并将查询原始表获取的数据与获取的与目标键值对应的数据合并为目标数据。
本发明实施例中,由于服务器中预先保存有包含键值与数据对应关系的各数据子立方体,因此,在接收数据查询请求后,得到数据查询请求对应的至少一个目标键值,服务器可以基于该目标键值,从各数据子立方体中,获取与数据查询请求匹配的目标数据,提高了数据查询的效率。
相对于上述方法实施例,本发明实施例还提供一种数据存储、查询和更新装置。
如图7所示,本发明实施例提供的一种数据存储装置,应用于服务器,所述装置包括:
构建模块401,用于构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;
第一判断模块402,用于判断所述当前层的数据子立方体是否满足预设合并条件,如果是,触发合并模块;
所述合并模块403,用于根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;
第二判断模块404,用于判断所述上一层数据子立方体是否满足所述预设合并条件,如果是,触发确定模块405,如果否,触发保存模块406;
所述确定模块405,用于将所述上一层数据子立方体作为当前层的数据子立方体,再触发所述合并模块;
所述保存模块406,用于保存所构建的多层数据子立方体。
本发明实施例中,一层一层的构建数据子立方体,形成树形层级结构的数据子立方体,由此,通过构建事实表中的每条信息对应的数据子立方体的方式进行历史数据的存储,在对已存储的历史数据进行更新时,更新历史数据对应的数据子立方体即可,可见通过本发明实施例提供的数据存储方法,可以实现对已存储的历史数据进行更新。
在本发明的一种实现方式中,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述构建模块401,可以具体用于:
针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性;
根据所述第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及所述第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息;
根据第二预设合并规则,将所述第一标识信息及所述第二标识信息合并为键值;
根据该条信息中包含的数据,确定每个键值对应的数据,并将所述键值与所述数据的对应关系作为数据子立方体。
在本发明的一种实现方式中,所述装置还包括:
第三判断模块,用于判断事实表中是否存在新信息,如果是,触发再构建模块;
所述再构建模块,用于再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条新信息,并触发所述第一判断模块402。
在本发明的一种实现方式中,所述预设合并条件为数据子立方体的数量达到预设数量值。
如图8所示,本发明实施例提供的一种数据更新装置,应用于服务器,所述装置包括:
获得模块501,用于获得事实表中记录的待更新信息;
待更新数据子立方体确定模块502,用于在预先保存的各层数据子立方体中,确定与所述待更新信息对应的待更新数据子立方体;
更新模块503,用于根据所述待更新信息对所述待更新数据子立方体进行数据更新;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
由于本发明实施例中构建了事实表中各条信息对应的数据子立方体,因此,在更新数据时,只需更新待更新数据对应的数据子立方体即可,无需对所有数据进行更新,减少了更新数据的耗时。
在本发明的一种实现方式中,所述更新模块503,可以包括:
数据量确定单元,用于确定所述待更新信息的数据量;
判断单元,用于判断所述待更新信息的数据量是否大于预设阈值,如果是,触发第一更新单元,如果否,触发第二更新单元;
所述第一更新单元,用于保存所述待更新信息,并在预设时间段内通过所保存的待更新信息对所述待更新数据子立方体进行数据更新;
所述第二更新单元,用于立即通过所述待更新信息对所述待更新数据子立方体进行数据更新。
如图9所示,本发明实施例提供的一种数据查询装置,应用于服务器,所述装置包括:
接收模块601,用于接收数据查询请求,所述数据查询请求包括至少一个关键词;
目标键值确定模块602,用于根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值;
目标数据获取模块603,用于基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时;根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
本发明实施例中,由于服务器中预先保存有包含键值与数据对应关系的各数据子立方体,因此,在接收数据查询请求后,得到数据查询请求对应的至少一个目标键值,服务器可以基于该目标键值,从各数据子立方体中,获取与数据查询请求匹配的目标数据,提高了数据查询的效率。
在本发明的一种实现方式中,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述目标键值确定模块602,可以包括:
标识信息确定单元,用于确定各关键词的维度属性,并根据所述第一预设对应关系及所述第二预设对应关系,确定所述各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
目标键值合并单元,用于根据第三预设合并规则,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
在本发明的一种实现方式中,所述目标键值合并单元,可以具体用于:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
在本发明的一种实现方式中,所述目标数据获取模块603,可以包括:
可用数据子立方体确定单元,用于确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询单元,用于查询所述使用状态为可用的数据子立方体,获取与所述目标键值对应的数据;
目标数据合并单元,用于根据第四预设合并规则,将获得的数据合并为目标数据。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (20)

1.一种数据存储方法,其特征在于,应用于服务器,所述方法包括:
构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;
判断所述当前层的数据子立方体是否满足预设合并条件;
如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;
判断所述上一层数据子立方体是否满足所述预设合并条件;
如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;
如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
2.根据权利要求1所述的方法,其特征在于,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述构建多个数据子立方体的步骤,包括:
针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性;
根据所述第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及所述第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息;
根据第二预设合并规则,将所述第一标识信息及所述第二标识信息合并为键值;
根据该条信息中包含的数据,确定每个键值对应的数据,并将所述键值与所述数据的对应关系作为数据子立方体。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断事实表中是否存在新信息,如果存在,再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条新信息,并执行所述判断所述当前层的数据子立方体是否满足预设合并条件的步骤。
4.根据权利要求1所述的方法,其特征在于,所述预设合并条件为数据子立方体的数量达到预设数量值。
5.一种数据更新方法,其特征在于,应用于服务器,所述方法包括:
获得事实表中记录的待更新信息;
在预先保存的各层数据子立方体中,确定与所述待更新信息对应的待更新数据子立方体;
根据所述待更新信息对所述待更新数据子立方体进行数据更新;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;判断所述当前层的数据子立方体是否满足预设合并条件;如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;判断所述上一层数据子立方体是否满足所述预设合并条件;如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
6.根据权利要求5所述的方法,其特征在于,所述根据所述待更新信息对所述待更新数据子立方体进行数据更新的步骤,包括:
确定所述待更新信息的数据量;
判断所述待更新信息的数据量是否大于预设阈值;
如果大于预设阈值,保存所述待更新信息,并在预设时间段内通过所保存的待更新信息对所述待更新数据子立方体进行数据更新;
如果未大于预设阈值,立即通过所述待更新信息对所述待更新数据子立方体进行数据更新。
7.一种数据查询方法,其特征在于,应用于服务器,所述方法包括:
接收数据查询请求,所述数据查询请求包括至少一个关键词;
根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值;
基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息且每个数据子立方体中包含键值与数据的对应关系;判断所述当前层的数据子立方体是否满足预设合并条件;如果满足所述预设合并条件,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;判断所述上一层数据子立方体是否满足所述预设合并条件;如果满足所述预设合并条件,将所述上一层数据子立方体作为当前层的数据子立方体,再执行根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体的步骤;如果不满足所述预设合并条件,保存所构建的多层数据子立方体。
8.根据权利要求7所述的方法,其特征在于,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值的步骤,包括:
确定各关键词的维度属性,并根据所述第一预设对应关系及所述第二预设对应关系,确定所述各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
根据第三预设合并规则,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
9.根据权利要求8所述的方法,其特征在于,所述根据第三预设合并规则,将所述第三标识信息及第四标识信息合并为至少一个目标键值的步骤,包括:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
10.根据权利要求6所述的方法,其特征在于,所述基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据的步骤,包括:
确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询所述使用状态为可用的数据子立方体,获取与所述目标键值对应的数据;
根据第四预设合并规则,将获得的数据合并为目标数据。
11.一种数据存储装置,其特征在于,应用于服务器,所述装置包括:
构建模块,用于构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;
第一判断模块,用于判断所述当前层的数据子立方体是否满足预设合并条件,如果是,触发合并模块;
所述合并模块,用于根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;
第二判断模块,用于判断所述上一层数据子立方体是否满足所述预设合并条件,如果是,触发确定模块,如果否,触发保存模块;
所述确定模块,用于将所述上一层数据子立方体作为当前层的数据子立方体,再触发所述合并模块;
所述保存模块,用于保存所构建的多层数据子立方体。
12.根据权利要求11所述的装置,其特征在于,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述构建模块,具体用于:
针对事实表中记录的每条信息,构建每条信息对应的数据子立方体,其中,构建一条信息对应的数据子立方体的过程为:
针对事实表中记录的一条信息,识别该条信息中记录的每个维度属性;
根据所述第一预设对应关系,确定每个维度属性对应的标识信息,并将所确定的标识信息作为第一标识信息;并根据该条信息每个维度属性对应的每个关键词,及所述第二预设对应关系,确定每个关键词对应的标识信息,并将所确定的标识信息作为第二标识信息;
根据第二预设合并规则,将所述第一标识信息及所述第二标识信息合并为键值;
根据该条信息中包含的数据,确定每个键值对应的数据,并将所述键值与所述数据的对应关系作为数据子立方体。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第三判断模块,用于判断事实表中是否存在新信息,如果是,触发再构建模块;
所述再构建模块,用于再构建多个数据子立方体,将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条新信息,并触发所述第一判断模块。
14.根据权利要求11所述的装置,其特征在于,所述预设合并条件为数据子立方体的数量达到预设数量值。
15.一种数据更新装置,其特征在于,应用于服务器,所述装置包括:
获得模块,用于获得事实表中记录的待更新信息;
待更新数据子立方体确定模块,用于在预先保存的各层数据子立方体中,确定与所述待更新信息对应的待更新数据子立方体;
更新模块,用于根据所述待更新信息对所述待更新数据子立方体进行数据更新;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时,根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
16.根据权利要求15所述的装置,其特征在于,所述更新模块,包括:
数据量确定单元,用于确定所述待更新信息的数据量;
判断单元,用于判断所述待更新信息的数据量是否大于预设阈值,如果是,触发第一更新单元,如果否,触发第二更新单元;
所述第一更新单元,用于保存所述待更新信息,并在预设时间段内通过所保存的待更新信息对所述待更新数据子立方体进行数据更新;
所述第二更新单元,用于立即通过所述待更新信息对所述待更新数据子立方体进行数据更新。
17.一种数据查询装置,其特征在于,应用于服务器,所述装置包括:
接收模块,用于接收数据查询请求,所述数据查询请求包括至少一个关键词;
目标键值确定模块,用于根据所述至少一个关键词,得到所述数据查询请求对应的至少一个目标键值;
目标数据获取模块,用于基于所述目标键值,遍历预先保存的各层数据子立方体,获取目标数据;
其中,预先保存各层数据子立方体的过程为:构建多个数据子立方体,并将所构建的多个数据子立方体作为当前层的数据子立方体,其中,每个数据子立方体对应事实表中记录的一条信息;在所述当前层的数据子立方体满足预设合并条件时;根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体满足所述预设合并条件时,将所述上一层数据子立方体作为当前层的数据子立方体,再根据第一预设合并规则,将所述当前层的数据子立方体合并为当前层的上一层数据子立方体;在所述上一层数据子立方体不满足所述预设合并条件时,保存所构建的多层数据子立方体。
18.根据权利要求17所述的装置,其特征在于,所述服务器中预先存储有第一预设对应关系和第二预设对应关系,所述第一预设对应关系为维度属性与标识信息的对应关系,所述第二预设对应关系为关键词与标识信息的对应关系;
所述目标键值确定模块,包括:
标识信息确定单元,用于确定各关键词的维度属性,并根据所述第一预设对应关系及所述第二预设对应关系,确定所述各关键词对应的第三标识信息及各维度属性对应的第四标识信息;
目标键值合并单元,用于根据第三预设合并规则,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
19.根据权利要求18所述的装置,其特征在于,所述目标键值合并单元,具体用于:
判断各关键词之间的关系;
如果各个关键词之间是与的关系时,根据所述各个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值;
如果各个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,将所述第三标识信息及所述第四标识信息合并为至少一个目标键值。
20.根据权利要求17所述的装置,其特征在于,所述目标数据获取模块,包括:
可用数据子立方体确定单元,用于确定所遍历的各层数据子立方体中使用状态为可用的数据子立方体;
查询单元,用于查询所述使用状态为可用的数据子立方体,获取与所述目标键值对应的数据;
目标数据合并单元,用于根据第四预设合并规则,将获得的数据合并为目标数据。
CN201611127382.XA 2016-12-09 2016-12-09 一种数据存储、更新和查询方法及装置 Active CN108614818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611127382.XA CN108614818B (zh) 2016-12-09 2016-12-09 一种数据存储、更新和查询方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611127382.XA CN108614818B (zh) 2016-12-09 2016-12-09 一种数据存储、更新和查询方法及装置

Publications (2)

Publication Number Publication Date
CN108614818A true CN108614818A (zh) 2018-10-02
CN108614818B CN108614818B (zh) 2020-12-25

Family

ID=63643451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611127382.XA Active CN108614818B (zh) 2016-12-09 2016-12-09 一种数据存储、更新和查询方法及装置

Country Status (1)

Country Link
CN (1) CN108614818B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442653A (zh) * 2019-07-03 2019-11-12 平安科技(深圳)有限公司 增量构建cube模型的方法、装置、服务器及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030225768A1 (en) * 2002-06-03 2003-12-04 Microsoft Corporation Workload analysis tool for relational databases
US20050076036A1 (en) * 2003-02-05 2005-04-07 International Business Machines Corporation Systems, methods, and computer program products to efficiently update multidimensional databases
CN104090987A (zh) * 2014-07-28 2014-10-08 华中科技大学 一种历史数据存储及索引方法
CN104252506A (zh) * 2013-06-28 2014-12-31 易保网络技术(上海)有限公司 同步构建业务模型和数据仓库模型及其映射的方法及系统
CN104573022A (zh) * 2015-01-12 2015-04-29 浪潮软件股份有限公司 一种HBase的数据查询方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030225768A1 (en) * 2002-06-03 2003-12-04 Microsoft Corporation Workload analysis tool for relational databases
US20050076036A1 (en) * 2003-02-05 2005-04-07 International Business Machines Corporation Systems, methods, and computer program products to efficiently update multidimensional databases
CN104252506A (zh) * 2013-06-28 2014-12-31 易保网络技术(上海)有限公司 同步构建业务模型和数据仓库模型及其映射的方法及系统
CN104090987A (zh) * 2014-07-28 2014-10-08 华中科技大学 一种历史数据存储及索引方法
CN104573022A (zh) * 2015-01-12 2015-04-29 浪潮软件股份有限公司 一种HBase的数据查询方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442653A (zh) * 2019-07-03 2019-11-12 平安科技(深圳)有限公司 增量构建cube模型的方法、装置、服务器及存储介质
CN110442653B (zh) * 2019-07-03 2023-09-29 平安科技(深圳)有限公司 增量构建cube模型的方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN108614818B (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
US10296522B1 (en) Index mechanism for report generation
CN103116639B (zh) 基于用户-物品二分图模型的物品推荐方法及系统
CN104598647B (zh) 一种树图搜索和匹配物品的方法
US7194456B2 (en) Method of querying a structure of compressed data
CN106528787A (zh) 一种基于海量数据多维分析的查询方法及装置
US7480662B2 (en) Fact table storage in a decision support system environment
CN107180093A (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN107657057A (zh) 一种企业征信信息融合图形化方法
CN104111936B (zh) 数据查询方法和系统
AU2005201996A1 (en) Combining multidimensional expressions and data mining extensions to mine OLAP cubes
CN104112011B (zh) 一种海量数据提取的方法及装置
CN103942299A (zh) 一种数据联动展示装置及展示方法
CN103226618A (zh) 基于数据集市挖掘的相关词提取方法及系统
CN104794146A (zh) 商品实时筛选和排序的方法和装置
CN109299199A (zh) 基于数据仓库的易制毒化学品多维分析系统及实现方法
CN101751475B (zh) 号段记录压缩方法及其装置
CN105468740B (zh) 一种游戏玩家数据的存储、分析方法及装置
CN104794237B (zh) 网页信息处理方法及装置
CN108614818A (zh) 一种数据存储、更新和查询方法及装置
CN106022702A (zh) 业务存储位置的分配方法及其系统
CN107993117A (zh) 信息展示方法和装置
CN104463627B (zh) 数据处理方法和装置
CN104537016B (zh) 一种确定文件所在分区的方法及装置
CN107273389A (zh) 庭审录像的查询方法和装置
CN105678616A (zh) 一种纳税人精细化分析方法、系统及税务数据管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant