WO2016004813A1

WO2016004813A1 - 数据存储方法、查询方法及设备

Info

Publication number: WO2016004813A1
Application number: PCT/CN2015/081651
Authority: WO
Inventors: 储晓颖
Original assignee: 阿里巴巴集团控股有限公司; 储晓颖
Priority date: 2014-07-07
Filing date: 2015-06-17
Publication date: 2016-01-14
Also published as: CN105446991A; EP3168758A4; US20180181606A1; JP6744854B2; CN105446991B; JP2017523513A; EP3168758A1; US10489372B2

Abstract

本发明提供一种数据存储方法、查询方法及设备。存储方法包括：接收待存储的数据记录；在数据记录包括时间戳、在时间戳所标识的时间点产生的数值以及可以标识数值的第一标识值组合时，根据用户的查询需求对数据记录进行预处理，获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征第二标识值组合的存储标识、目标时间和目标数值对应存储到第二信息表中，并将第一标识值组合存储到第一信息表中。本发明可以降低创建和维护次级索引的工作量，有利于提高数据存储和查询速度，提高存储系统的性能。

Description

数据存储方法、查询方法及设备

【技术领域】

本发明涉及网络技术领域，尤其涉及一种数据存储方法、查询方法及设备。

【背景技术】

随着非关系型数据库(NOSQL)在业界的推广，传统的关系型数据库(Relational Database Management System，RDBMS)受到很大挑战。虽然NOSQL支持键值对(key-value)存储方式，但在很多场景下依然会像RDBMS那样定义表(table)，为表设计多个列(column)，为除主键以外的其他列创建次级索引；之后SQL会像使用RDBMS那样使用该NOSQL产品。

当表中数据行较多时，为表中的多个列创建并维护次级索引会严重影响存储系统的性能，导致存储和查询速度较低。

【发明内容】

本发明的多个方面提供一种数据存储方法、查询方法及设备，用以提高数据存储和查询速度，提高存储系统的性能。

本发明的一方面，提供一种数据存储方法，包括：

接收待存储的数据记录；

在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值以及可以标识所述数值的第一标识值组合时，根据用户的查询需求对所述数据记录进行预处理，获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中，并将所述第一标识值组合存储到第一信息表中；

其中，与时间无关的多维标识字段的一种取值构成所述第一标识值组合。

本发明的另一方面，提供一种数据存储设备，包括：

接收模块，用于接收待存储的数据记录；

第一存储模块，用于在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值和可以标识所述数值的第一标识值组合时，根据用户的查询需求对所述数据记录进行预处理，获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值存储到第二信息表中，并将所述第一标识值组合存储到第一信息表中；

本发明的又一方面，提供一种数据查询方法，包括：

接收查询请求；

在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足所述过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，所述过滤条件包括部分标识字段的取值；

在所述查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询，获取对应于所述目标时间和所述存储标识的目标数值。

本发明的又一方面，提供一种数据查询设备，包括：

接收模块，用于接收查询请求；

第一查询模块，用于在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足所述过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，所述过滤条件包含部分标识字段的取值；

第二查询模块，用于在所述查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询，获取对应于所述目标时间和所述存储标识的目标数值。

在本发明技术方案中，通过对待存储数据记录中的内容进行分类，将与时间无关的内容，例如多维标识字段的取值存储到第一信息表中，这样第一信息表中存储的是与时间无关的内容，数据量相对较少，创建和维护次级索引的工作量大大降低了；对于与时间有关的内容，根据用户的查询需求对数据记录进行预处理直接获得满足用户的查询需求的信息，即目标数值、目标时间和表征查询条件的存储标识，通过预处理一定程度上可以减少第二信息表中的数据量，另外通过存储目标数值、目标时间和存储标识使得第二信息表不需要建立次级索引。与现有技术相比，本发明技术方案创建和维护次级索引的工作量极大的降低了，并且存储的数据量也有所降低，因此可以提高数据存储速度，提高存储系统的性能；相应的，在进行数据查询时，直接查询第二信息表时不再依赖次级索引，有利于提高查询速度，即使需要查询第一信息表，但由于第一信息表所维护的次级索引较少，所以与现有技术相比查询速度也有所提高。

【附图说明】

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1a为本发明一实施例提供的数据存储方法的流程示意图；

图1b为本发明另一实施例提供的数据存储方法的流程示意图；

图2为本发明一实施例提供的数据查询方法的流程示意图；

图3a为本发明一实施例提供的数据存储设备的结构示意图；

图3b为本发明另一实施例提供的数据存储设备的结构示意图；

图4为本发明一实施例提供的数据查询设备的结构示意图。

【具体实施方式】

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在对本发明技术方案进行说明之前，结合具体的应用场景说明一下现有存储方案存在的缺陷。

表1

表1是在数据分析领域常见的一种应用场景，表1中的内容是对第三方支付公司交易系统的各种各样行为的记录。在表1中，接口、方法就是面向服务的体系结构(Service-Oriented Architecture，SOA)领域中常用的服务标识，接口代表某种服务，方法代表这种服务下的一种具体行为，create和pay分别代表此服务下的订单创建业务和订单支付业务；来源表示此笔业务的调用方是来自Taobao(淘宝网站)还是Tmall(天猫网站)，结果顾名思义Y/N分别代表了此笔业务的最终结果是成功还是失败；金额是一个数值，表示此笔交易的金额。

根据应用需求可以基于表1进行各种信息的查询。例如，可以查询2013-11-11 00:00这个时刻下，各种[接口,方法,来源,结果]组合下的金额分别是多少。又例如还可以查询2013-11-11 00:00这个时刻下，[接口＝TradeFacade,方法＝create或pay]的总金额。又例如还可以查询交易服务下的订单创建业务到底有多少种可能的来源，该来源在表1中对应的是Taobao和Tmall。

由上述可见，需要为表1中的接口、方法、来源、结果各列建立并维护次级索引，以避免查询过程中遍历全表。但是表1中的数据行会随着时间不断累积，当表1中数据行较多时，为多个列创建并维护次级索引将是一项代价巨大的工作，会严重影响存储系统的性能，降低存储和查询速度。

针对上述问题，图1a为本发明一实施例提供的数据存储方法的流程示意图，如图1a所示，该方法包括：

101、接收待存储的数据记录。

102、在上述数据记录包括时间戳、在时间戳所标识的时间点产生的数值和可以标识该数值的第一标识值组合时，根据用户的查询需求对上述数据记录进行预处理，获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征第二标识值组合的存储标识、目标时间和目标数值存储到第二信息表中，并将第一标识值组合存储到第一信息表中；其中，与时间无关的多维标识字段的一种取值构成第一标识值组合。

数据记录是指对应于数据源中一组完整的相关信息，以表1为例，表1中一行数据就是一条数据记录。本实施例中的数据记录可以来自但不限于业务系统。这里的业务系统可以是任何领域的业务系统，例如可以是商品交易业务系统、银行业务系统、收费站管理业务系统等等。

当业务系统有业务要处理时，一般会产生数据记录，这些数据记录一般需要进行存储。举例说明，当有商品交易时，会产生商品交易信息，例如商品名称、交易时间、交易金额、商品提供商等，一条商品交易信息即为一条数据记录。又例如，当银行发生转账或汇款等业务时，会记录与转账或汇款有关的信息，例如转账或汇款账号、收款账号、转账或汇款金额、转账或汇款日期等，一条银行转账或汇款记录就是一条数据记录。

基于上述，数据存储设备可以接收业务系统发送的待存储的数据记录。

无论是上面的商品交易业务系统、银行业务系统还是收费站管理业务系统，其产生的数据记录中可以包括与时间有关的内容，还可以包括与时间无关的内容。结合上述表1，其中“时间”和“金额”会随着时间的变化而变化，而对于“接口”、“方法”、“来源”和“结果”，其变化并不是随着时间流逝而持续增长的交易订单，而是源自频率较低的业务规则变化，例如接入了新的商家，或者提供了新的服务，例如理财服务。

表1中的“时间”和“金额”分别对应本实施例中的时间戳和数值；表1中的“接口”、“方法”、“来源”和“结果”对应本实施例中的多维标识字段，这些字段的一种取值可以唯一标识某个时间对应的金额。

对于商品交易来说，交易时间以及交易的金额会随着时间的变化而变化，一般是随着时间的增加而累积，但是对于商品名称、商品提供商等一旦确定不会随着时间的流逝而持续增长，除非有新的商品出现或有新的商品提供商等低概率事件出现。对于银行系统来说，转账或汇款的时间以及转账或汇款的金额会随着时间的变化而变化，一般是随着时间的增加而累积，但是对于银行名称、银行地址、转账或汇款的账户、收款账户等一旦确定不会随着时间的流逝而持续增长，除非有银行变更地址或有新的用户在该银行开户等低概率事件的出现。

经过上述分析可以发现，数据记录中与时间有关的内容一般是业务发生的时间和在该时间因进行业务而产生的数值，本实施例中将业务发生的时间记为时间戳，将在时间戳所标识的时间点进行业务所产生的数值记为在该时间戳所标识的时间点产生的数值。例如，对于商品交易来说，时间戳就是产生商品交易的时间，而在该时间戳所标识的时间点产生的数值就是商品交易金额。又例如，对银行系统来说，时间戳就是转账或汇款发生的时间点，而在该时间戳所标识的时间点产生的数值就是转账或汇款的金额。

进一步发现，数据记录中与时间无关的内容一般是指变化频率较低且可以标识在上述时间戳所标识的时间点产生的数值的多维标识字段的某种取值。标识字段的取值可以称为标识字段值，多维标识字段的取值的组合可以称为第一标识值组合。对于相同的多维标识字段可以有多种取值，也就意味着可以有多个第一标识值组合。例如，对于商品交易来说，一般通过商品名称、商品提供商等字段的取值来唯一标识一次交易。又例如，对银行系统来说，可以通过银行名称、转账或汇款账号和收款账号等字段的取值唯一标识一次转账或汇款业务。

在接收到数据记录后，数据存储设备可以对数据记录包括的内容进行判断，当确定出该数据记录包括时间戳、在该时间戳所标识的时间点产生的数值以及可以标识该数值的第一标识值组合时，根据用户的查询需求对上述数据记录进行预处理，获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征第二标识值组合的存储标识、目标时间和目标数值存储到第二信息表中，并将第一标识值组合存储到第一信息表中。值得说明的是，如果第一信息表中已经存在第一标识值组合，可以直接覆盖掉之前已经存在的第一标识值组合；如果第一信息表中不存在第一标识值组合，则直接将第一标识值组合存储到第一信息表中。

其中，第二标识值组合是指在查询时作为查询条件的多维标识字段的一种取值。第二标识值组合与第一标识值组合可能对应相同个数的标识字段，也可能对应不同个数的标识字段。其中，第二标识值组合对应的标识字段的个数应该小于或等于第一标识值组合对应的标识字段的个数。结合上述表1，第二标识值组合可以是“接口”、“方法”两个标识字段的一种取值，或者也可以是“接口”、“方法”和“来源”三个标识字段的一种取值，等等。

在本实施例中，数据存储设备上预先配置用于对数据记录中的内容进行分类的分类规则，数据存储设备可以基于该分类规则，对接收到的数据记录中的内容进行分类。例如，该分类规则可以直接规定将数据记录中的时间戳和数值字段作为与时间有关的内容，将其他字段内容作为与时间无关的内容。

在本实施例中，数据存储设备对数据记录中的内容进行分类，一类是与时间有关的内容，例如时间戳和数值，一类是与时间无关的内容，例如多维标识字段的取值，即第一标识值组合，并通过第一信息表和第二信息表分别对与时间无关的内容和与时间有关的内容进行分类存储。这样第一信息表中存储的是与时间无关的内容，数据量相对较少，创建和维护次级索引的工作量会大大降低；相应的，当需要查询第一信息表时，由于第一信息表所维护的次级索引较少，查询速度也会有所提高。

另外，数据存储设备可以预先获知用户的查询需求，这里所说的用户的查询需求是指在对数据记录进行存储之后，用户可能发生的查询。针对不同的业务系统，用户的查询需求会有所不同。一旦数据记录对应的业务系统确定，用户的查询需求一般也就确定了。例如，对于商品交易业务系统，用户可能需要查找所有购买了指定商品提供商提供的商品的各交易涉及的交易额，或者需要查找指定时间段发生的商品交易涉及的交易额之和，又或者需要查找在指定时间段内购买了指定商品的各交易涉及的交易额，等等。上述举例中涉及的指定商品提供商、指定时间段、指定商品等即为用户查询需求中的查询条件。

基于上述，对于与时间有关的内容，在进行存储之前，数据存储设备先根据用户的查询需求对数据记录进行预处理，获得满足用户的查询需求的信息，即目标数值、目标时间以及作为查询条件的第二标识值组合，并通过可以表征第二标识值组合的存储标识代替第二标识值组合。经过上述处理，第二信息表中会存储三类信息：存储标识、目标时间和目标数值，由此可见，第二信息表与现有技术中纯粹的键值对表相比，仅多出了目标时间，该目标时间可以作为第二信息表的主键，另外两个信息不需要建立次级索引，第二信息表不仅数据量有所减少，而且不需要建立和维护次级索引；并且由于第二信息表中存储的是已经满足查询需求的信息，在查询过程中当接收到查询请求后无需进行计算，可以直接获得查询结果，有利于提高查询速度。

值得说明的是，上述目标数值可能是数据记录中的数值，也可能是根据查询需求对数据记录中的数值进行一定处理获得的。举例说明，如果查询需求是查询每条数据记录中数值，则目标数值就是数据记录中的数值；如果查询需求是按照预设周期查询每个周期内产生的数据记录中数值的总和，则目标数值就是每个周期内所有数据记录中数值的之和。另外，上述目标时间可能是数据记录中的时间戳，也可能是根据查询需求所确定的与时间戳有关的时间。举例说明，如果查询需求是查询每条数据记录中数值，则目标时间就是数据记录中的时间戳；如果查询需求是按照预设周期查询每个周期内产生的数据记录中数值的总和，则目标时间就是每个查询周期对应的时间点。

相应的，对于上述作为查询条件的第二标识值组合，如果查询条件包括了全部多维标识字段的取值，则第二标识值组合就等同于第一标识值组合；如果查询条件仅包括了多维标识字段中部分标识字段的取值，则第二标识值组合仅是部分标识字段的取值，并不等同于第一标识值组合。

图1b为本发明另一实施例提供的数据存储方法的流程示意图。如图1b 所示，该方法包括：

1a、接收待存储的数据记录。

1b、对上述数据记录包括的内容进行判断，如果包括时间戳、在时间戳所标识的时间点产生的数值以及可以标识数值的第一标识值组合，则执行步骤1c；如果不包括时间戳和在时间戳所标识的时间点产生的数值，但包括可以标识该数值的第一标识值组合，则执行步骤1d。

1c、根据用户的查询需求对上述数据记录进行预处理，获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征第二标识值组合的存储标识、目标时间和目标数值存储到第二信息表中，并将第一标识值组合存储到第一信息表中；其中，与时间无关的多维标识字段的一种取值构成第一标识值组合。

1d、将上述第一标识值组合存储到第一信息表中。

在此说明，本实施例可基于图1所示实施例实现，与图1所示实施例相同的地方不再赘述。

在本实施例中，考虑到多维标识字段的取值(即第一标识值组合)可能会发生变化的情况，例如对于表1中的“接口”、“方法”、“来源”和“结果”可能会因为业务规则的变化而变化，因此，接收到数据记录后，判断数据记录是否包括时间戳和在时间戳所标识的时间点产生的数值，如果数据记录不包括时间戳和在时间戳所标识的时间点产生的数值，则说明数据记录包括的是与时间无关的内容，即第一标识值组合，需要将该第一标识值组合存储到第一信息表中，由于不涉及与时间有关的内容，因此不需要对第二信息表进行操作。本实施例提供的方法可以适应用户的各种存储需求。

在一可选实施方式中，上述步骤102或步骤1c或步骤1d中将第一标识值组合存储到第一信息表中的方式包括：

向第一信息表所在的第一设备发送第一写请求，以使第一设备在确定第一信息表中不存在第一标识值组合时将第一标识值组合写入第一信息表中，第一写请求包括第一标识值组合。

具体的，向第一信息表所在的第一设备发送第一写请求，在第一写请求中携带上述第一标识值组合。第一设备接收到第一写请求后，从中获取第一标识值组合，在第一信息表中查询是否已经存在该第一标识值组合，如果该第一标识值组合已经存在，则忽略第一写请求中携带的第一标识值组合，如果该第一标识值组合不存在，则将该第一标识值组合写入第一信息表中。

在一可选实施方式中，上述步骤102或步骤1c中将表征第二标识值组合的存储标识、目标时间和目标数值存储到第二信息表中，包括：

向第二信息表所在的第二设备发送第二写入请求，以使第二设备确定表征第二标识值组合的存储标识并将存储标识、目标时间和目标数值对应写入第二信息表中，第二写请求包括第二标识值组合、目标时间和目标数值。

具体的，向第二信息表所在的第二设备发送第二写入请求，并在第二写请求中携带第二标识值组合、目标时间和目标数值。第二设备接收到第二写请求后，从第二写请求中获取第二标识值组合、目标时间和目标数值，之后将第二标识值组合唯一映射为一个存储标识，将该存储标识、目标时间和目标数值对应存储到第二信息表中。这里存储表征第二标识值组合的存储标识占用字节数远小于第二标识值组合，因此存储表征第二标识值组合的存储标识，有利于节约存储空间，并且有利于检索。

在此说明，上述第一信息表和第二信息表可以存储在同一设备上，也可以分别存储到不同的设备上。即上述第一设备和第二设备可以是同一设备，也可以是不同设备。较为优选的，由于两个信息表所存储的数据的结构差别较大，导致两个信息表的实现结构差异较大，因此，可以分别存储在不同的设备。

在一可选实施方式中，本实施例的第一信息表可以称为维度(dimension)表，相应的，第二信息表可以称为记录(record)表，但不限于此。

对表1所示应用场景，当采用本实施例提供的方法进行存储后会得到表2和表3，表2为第一信息表，表3为第二信息表。

表2

接口	方法	来源	结果
接口	方法	来源	结果	TradeFacade	创建(create)	淘宝(Taobao)	Y
TradeFacade	支付(pay)	Taobao	Y	TradeFacade	创建(create)	淘宝(Taobao)	Y
TradeFacade	支付(pay)	Taobao	Y	TradeFacade	create	天猫(Tmall)	Y
TradeFacade	pay	Tmall	Y	TradeFacade	create	天猫(Tmall)	Y
TradeFacade	pay	Tmall	Y	TradeFacade	pay	Tmall	N
……				TradeFacade	pay	Tmall	N

表3

存储标识	时间	金额(元)
存储标识	时间	金额(元)	ID1	2013-11-11 00:00	1459
ID2	2013-11-11 00:00	7398	ID1	2013-11-11 00:00	1459
ID2	2013-11-11 00:00	7398	ID3	2013-11-11 00:00	6999
ID4	2013-11-11 00:00	399	ID3	2013-11-11 00:00	6999
ID4	2013-11-11 00:00	399		……

其中，表2中存储的是“接口”、“方法”、“来源”和“结果”的取值组合，即第一标识值组合。表2中数据行的数量要远远少于表1中数据行的数量，因此为表2创建和维护次级索引工作量要小很多，会极大的降低对存储系统的影响，有利于提高存储效率。

表3中存储的是经过预处理后获得的满足用户的查询需求的目标数值(对应表3中的“金额”)、目标时间(对应表3中的“时间”)和存储标识。表3中第一行表示：2013-11-11 00:00这个时刻下，[接口＝TradeFacade,方法＝create]的总金额，则ID1所表征的第二标识值组合(即查询条件)为：[接口＝TradeFacade,方法＝create]；第二行表示：2013-11-11 00:00这个时刻下，[接口＝TradeFacade,方法＝pay]的总金额，则ID2所表征的第二标识值组合(即查询条件)为：[接口＝TradeFacade,方法＝pay]；第三行表示：2013-11-11 00:00这个时刻下，[接口＝TradeFacade,方法＝pay,且结果＝Y]的总金额，则ID3所表征的第二标识值组合(即查询条件)为：[接口＝TradeFacade,方法＝pay,且结果＝Y]；第四行表示：2013-11-11 00:00这个时刻下，[接口＝TradeFacade,方法＝pay,且结果＝N]的总金额，则ID4所表征的第二标识值组合(即查询条件)为：[接口＝TradeFacade,方法＝pay,且结果＝N]。表3中存储标识和金额两列构成键值(key-value)对，是不需要建立索引的，而时间列可以作为主键，也就是说表3不需要建立次级索引，进一步降低对存储系统的影响，有利于提高存储效率。

经过上述分析可知，本实施例提供的方法通过对待存储数据记录中的内容进行分类，将与时间无关的内容，例如多维标识字段的取值存储到第一信息表中，这样第一信息表中存储的是与时间无关的内容，数据量相对较少，创建和维护次级索引的工作量大大降低了；对于与时间有关的内容，根据用户的查询需求对数据记录进行预处理直接获得满足用户的查询需求的信息，即目标数值、目标时间和表征查询条件的存储标识，通过预处理一定程度上可以减少第二信息表中的数据量，另外通过存储目标数值、目标时间和存储标识使得第二信息表不需要建立次级索引。与现有技术相比，本实施例创建和维护次级索引的工作量极大的降低了，并且存储的数据量也有所降低，因此可以提高数据存储速度，提高存储系统的性能；相应的，在进行数据查询时，直接查询第二信息表时不再依赖次级索引，有利于提高查询速度，即使需要查询第一信息表，但由于第一信息表所维护的次级索引较少，所以与现有技术相比查询速度也有所提高。

另外，第二信息表存储的不再是完整维度的统计结果，更不是逐条存储原始交易记录，而是直接存储查询所需的结果。这样的好处显而易见，查询的时候直接对存储标识进行检索，不再需要任何次级索引，有利于提高查询速度。

下面结合本发明上述实施例提供的数据存储方法，对本发明提供的数据查询方法的流程进行说明。

图2为本发明一实施例提供的数据查询方法的流程示意图。如图2所示，该方法包括：

201、接收查询请求。

202、在上述查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据该过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足该过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，该过滤条件包含部分标识字段的取值。

203、在上述查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征上述第二标识值组合的存储标识和上述目标时间在第二信息表中进行查询，获取对应于上述目标时间和存储标识的目标数值。

具体的，当用户有查询需求时可以向本实施例的执行主体，例如数据查询设备发送查询请求，该查询请求包含进行查询所需的信息。

数据查询设备接收查询请求，对查询请求包括的内容进行判断。当确定查询请求包括过滤条件但不包括目标时间时，说明该查询请求用以查询满足该过滤条件的多维标识字段的取值，于是直接根据该过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足该过滤条件的第一标识值组合。其中，满足过滤条件的第一标识值组合可以是一个或者多个。过滤条件包含部分标识字段的取值。

当确定查询请求包括作为查询条件的第二标识值组合和目标时间时，说明该查询请求用以查询对应于该目标时间和第二标识值组合的数值，于是直接根据表征该第二标识值组合的存储标识和目标时间在第二信息表中进行查询，获取与目标时间和表征第二标识值组合的存储标识对应的目标数值。第二信息表中存储有表征第二标识值组合的存储标识、目标时间和目标数值。

在一可选实施方式中，上述步骤202中根据过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足该过滤条件的第一标识值组合，包括：

向第一信息表所在的第一设备发送第一读请求，以使第一设备从第一信息表中读取满足该过滤条件的第一标识值组合。其中，第一读请求包括过滤条件。

具体的，数据查询设备向第一设备发送第一读请求，并在第一读请求中携带过滤条件。第一设备接收第一读请求，从中获取过滤条件，根据该过滤条件在第一信息表中进行查找，获取满足该过滤条件的第一标识值组合。

在一可选实施方式中，上述步骤203中根据表征第二标识值组合的存储标识和目标时间在第二信息表中进行查询，获取对应于目标时间和存储标识的目标数值，包括：

向第二信息表所在的第二设备发送第二读请求，以使第二设备确定表征第二标识值组合的存储标识，从第二信息表中读取与该存储标识和目标时间对应的目标数值；其中，第二读请求包括第二标识值组合和目标时间。

具体的，数据查询设备向第二设备发送第二读请求，并在第二读请求中携带第二标识值组合和目标时间。第二设备接收第二读请求，从中获取第二标识值组合和目标时间，确定表征第二标识值组合的存储标识，根据所确定的存储标识和目标时间在第二信息表中进行查找，获取与该存储标识和目标时间戳对应的目标数值。

在此说明，本实施例涉及到第一信息表和第二信息表的其他信息，以及其他一些名词(例如第一标识值组合、第二标识值组合等)解释或说明可参见图1a所示实施例中的描述。

由上述可见，在分类存储的基础上，当需要查询数值时，直接查询第二信息表，不需要任何次级索引，有利于提高查询速度，当查询标识值组合时，直接查询第一信息表，由于第一信息表的数据行较少，次级索引较少，与现有技术相比，同样可以提高查询速度。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

图3a为本发明一实施例提供的数据存储设备的结构示意图。如图3a所示，该设备包括：接收模块31和第一存储模块32。

接收模块31，用于接收待存储的数据记录。

第一存储模块32，与接收模块31连接，用于在接收模块31接收的数据记录包括时间戳、在该时间戳所标识的时间点产生的数值和可以标识该数值的第一标识值组合时，根据用户的查询需求对该数据记录进行预处理，获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征该第二标识值组合的存储标识、目标时间和目标数值存储到第二信息表中，并将第一标识值组合存储到第一信息表中。

在一可选实施方式中，如图3b所示，该设备还包括：第二存储模块33。

第二存储模块33，与接收模块31连接，用于在接收模块31接收的数据记录不包括时间戳和在时间戳所标识的时间点产生的数值，但包括可以标识数值的第一标识值组合时，将第一标识值组合存储到第一信息表中。

在一可选实施方式中，第二存储模块33具体可用于在接收模块31接收的数据记录不包括时间戳和数值，但包括第一标识值组合时，向第一信息表所在的第一设备发送第一写请求，以使第一设备在确定第一信息表中不存在第一标识值组合时将第一标识值组合写入第一信息表中，该第一写请求包括第一标识值组合。

在一可选实施方式中，第一存储模块32具体可用于在接收模块31接收的数据记录包括时间戳、数值和第一标识值组合时，根据用户的查询需求对数据记录进行预处理，获得满足用户的查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，向第二信息表所在的第二设备发送第二写入请求，以使第二设备确定表征第二标识值组合的存储标识并将存储标识、目标时间和目标数值对应写入第二信息表中，以及向第一信息表所在的第一设备发送第一写请求，以使第一设备在确定第一标识值组合不存在第一信息表中时将第一标识值组合存储到第一信息表中。这里的第一写请求包括上述第一标识值组合，第二写请求包括第二标识值组合、目标时间和目标数值。

本实施例提供的数据存储设备的各功能模块可用于执行图1a或图1b所示数据存储方法的流程，其具体工作原理不在赘述，详见方法实施例的描述。

本实施例提供的数据存储设备，通过对待存储数据记录中的数据进行分类，将与时间有关的数据，例如时间戳和数值存储到第二信息表中，这样第一信息表中存储的是与时间无关的内容，数据量相对较少，创建和维护次级索引的工作量大大降低了；对于与时间有关的内容，根据用户的查询需求对数据记录进行预处理直接获得满足用户的查询需求的信息，即目标数值、目标时间和表征查询条件的存储标识，通过预处理一定程度上可以减少第二信息表中的数据量，另外通过存储目标数值、目标时间和存储标识使得第二信息表不需要建立次级索引。与现有技术相比，本实施例的数据存储设备创建和维护次级索引的工作量极大的降低了，并且存储的数据量也有所降低，因此可以提高数据存储速度，提高存储系统的性能。

图4为本发明一实施例提供的数据查询设备的结构示意图。如图4所示，该数据查询设备包括：接收模块41、第一查询模块42和第二查询模块43。

接收模块41，用于接收查询请求。

第一查询模块42，与接收模块41连接，用于在接收模块41接收的查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，过滤条件包含部分标识字段的取值。

第二查询模块43，与接收模块41连接，用于在接收模块41接收的查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征第二标识值组合的存储标识和目标时间在第二信息表中进行查询，获取对应于目标时间和存储标识的目标数值。

在一可选实施方式中，第一查询模块42具体可用于在接收模块41接收的查询请求包括作为查询条件的过滤条件但不包括目标时间时，向第一信息表所在的第一设备发送第一读请求，以使第一设备从第一信息表中读取满足该过滤条件的第一标识值组合。其中，第一读请求包括过滤条件。

在一可选实施方式中，第二查询模块43具体可用于在接收模块41接收的查询请求包括作为查询条件的第二标识值组合和目标时间时，向第二信息表所在的第二设备发送第二读请求，以使第二设备确定可以表征第二标识值组合的存储标识，从第二信息表中读取与表征第二标识值组合的存储标识和目标时间对应的目标数值；其中，第二读请求包括第二标识值组合和目标时间。

本实施例提供的数据查询设备的各功能模块可用于执行图2所示方法实施例的流程，其具体工作原理不再赘述，详见方法实施例的描述。

本实施例提供的数据查询设备，与上述实施例提供的数据存储设备相配合，在分类存储的基础上，当需要查询数值时，直接查询第二信息表，不需要任何次级索引，有利于提高查询速度，当查询标识值组合时，直接查询第一信息表，由于第一信息表的数据行较少，次级索引较少，与现有技术相比，同样可以提高查询速度。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种数据存储方法，其特征在于，包括：

接收待存储的数据记录；

在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值以及可以标识所述数值的第一标识值组合时，根据用户的查询需求对所述数据记录进行预处理，获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中，并将所述第一标识值组合存储到第一信息表中；

其中，与时间无关的多维标识字段的一种取值构成所述第一标识值组合。
根据权利要求1所述的方法，其特征在于，还包括：

在所述数据记录不包括时间戳和在所述时间戳所标识的时间点产生的数值，但包括可以标识所述数值的第一标识值组合时，将所述第一标识值组合存储到第一信息表中。
根据权利要求1或2所述的方法，其特征在于，所述将所述第一标识值组合存储到第一信息表中，包括：

向所述第一信息表所在的第一设备发送第一写请求，以使所述第一设备在确定所述第一信息表中不存在所述第一标识值组合时将所述第一标识值组合写入所述第一信息表中，所述第一写请求包括所述第一标识值组合。
根据权利要求1或2所述的方法，其特征在于，所述将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中，包括：

向所述第二信息表所在的第二设备发送第二写入请求，以使所述第二设备确定表征所述第二标识值组合的存储标识并将所述存储标识、所述目标时间和所述目标数值对应写入所述第二信息表中，所述第二写请求包括所述第二标识值组合、所述目标时间和所述目标数值。
一种数据存储设备，其特征在于，包括：

接收模块，用于接收待存储的数据记录；

第一存储模块，用于在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值和可以标识所述数值的第一标识值组合时，根据用户的查询需求对所述数据记录进行预处理，获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值存储到第二信息表中，并将所述第一标识值组合存储到第一信息表中；

其中，与时间无关的多维标识字段的一种取值构成所述第一标识值组合。
根据权利要求5所述的设备，其特征在于，还包括：

第二存储模块，用于在所述数据记录不包括时间戳和在所述时间戳所标识的时间点产生的数值，但包括可以标识所述数值的第一标识值组合时，将所述第一标识值组合存储到第一信息表中。
根据权利要求6所述的设备，其特征在于，所述第二存储模块具体用于在所述数据记录不包括所述时间戳和所述数值，但包括所述第一标识值组合时，向所述第一信息表所在的第一设备发送第一写请求，以使所述第一设备在确定所述第一信息表中不存在所述第一标识值组合时将所述第一标识值组合写入所述第一信息表中，所述第一写请求包括所述第一标识值组合。
根据权利要求5或6或7所述的设备，其特征在于，所述第一存储模块具体用于在所述数据记录包括所述时间戳、所述数值和所述第一标识值组合时，根据用户的查询需求对所述数据记录进行预处理，获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合，向所述第二信息表所在的第二设备发送第二写入请求，以使所述第二设备确定表征所述第二标识值组合的存储标识并将所述存储标识、所述目标时间和所述目标数值对应写入所述第二信息表中，以及向所述第一信息表所在的第一设备发送第一写请求，以使所述第一设备在确定所述第一信息表中不存在所述第一标识值组合时将所述第一标识值组合写入所述第一信息表中，所述第一写请求包括所述第一标识值组合，所述第二写请求包括所述第二标识值组合、所述目标时间和所述目标数值。
一种数据查询方法，其特征在于，包括：

接收查询请求；

在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足所述过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，所述过滤条件包括部分标识字段的取值；

在所述查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询，获取对应于所述目标时间和所述存储标识的目标数值。
一种数据查询设备，其特征在于，包括：

接收模块，用于接收查询请求；

第一查询模块，用于在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时，根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询，获取满足所述过滤条件的第一标识值组合；其中，与时间无关的多维标识字段的一种取值构成一个第一标识值组合，所述过滤条件包含部分标识字段的取值；

第二查询模块，用于在所述查询请求包括作为查询条件的第二标识值组合和目标时间时，根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询，获取对应于所述目标时间和所述存储标识的目标数值。