WO2017049757A1

WO2017049757A1 - 存储时间序列数据的方法和装置

Info

Publication number: WO2017049757A1
Application number: PCT/CN2015/095636
Authority: WO
Inventors: 薛英飞; 赖春波; 王仆; 赵博; 郑锋
Original assignee: 北京百度网讯科技有限公司
Priority date: 2015-09-22
Filing date: 2015-11-26
Publication date: 2017-03-30
Also published as: CN105260404B; US10606806B2; CN105260404A; US20180329921A1

Abstract

一种存储时间序列数据的方法和装置。所述存储时间序列数据的方法包括：根据时间序列数据的时间点，将时间序列数据的指标值存入时间区间数据表中（201），其中，时间序列数据包括以下信息：时间点、与时间点关联的指标值，时间区间数据表中的每条数据行记录预定长度的时间区间内的至少一个时间点所关联的指标值，各个时间点之间相隔预定的时间长度，每个时间点占用内存的一个存储区，每个存储区包括预定个数的字节，每个时间点所关联的指标值被填入时间点所占用的存储区中；将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据（202）；将时间区间压缩数据写入磁盘（203）。该方法减少了磁盘存储空间的占用。

Description

存储时间序列数据的方法和装置

相关申请的交叉引用

本申请要求北京百度网讯科技有限公司于2015年09月22日提交的，发明名称为“存储时间序列数据的方法和装置”的、中国专利申请号“201510608162.8”的优先权，其全部内容作为整体并入本申请中。

技术领域

本申请涉及计算机技术领域，具体涉及数据库技术领域，尤其涉及存储时间序列数据的方法和装置。

背景技术

时间序列数据是一系列有序的数据，是在不同时间点上收集到的数据。这类数据反映了某一事物、现象、指标等随时间的变化状态或程度。由于时间序列数据通常是相等时间间隔的采样数据，现有的存储时间序列数据的方法通常为：根据上述时间间隔，为每个固定的时间点预留一个存储区。当接收到一个时间点的时间序列数据时，将该数据填入预留给该时间点的存储区中。

然而，目前在实际的情况中，很多时间序列数据不一定在每个时间间隔后都会产生，甚至时间间隔有可能会发生变化，这导致了有很多的存储区中的数据为空值状态，如果将这些包含空值的数据直接写入磁盘，会产生较多的存储空间占用，并增加了后续读写数据时的IO流量。

发明内容

本申请的目的在于提出一种存储时间序列数据的方法和装置，来解决以上背景技术部分提到的技术问题。

第一方面，本申请提供了一种存储时间序列数据的方法，所述方法包括：根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；将所述时间区间压缩数据写入磁盘。

在一些实施例中，所述时间区间数据表包括主键列，所述时间区间数据表中的每条数据行的主键值包括表示所述数据行对应的时间区间的起点的起始时间点值。

在一些实施例中，所述根据所述时间序列数据的时间，将所述时间序列数据的指标值存入时间区间数据表中，包括：根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行；如果匹配到所述对应的数据行，则将所述时间序列数据的指标值填入所述数据行中与所述时间点对应的存储区中；如果没有匹配到所述数据行，则新增一条新数据行，所述新增的数据行的主键值包括所述时间序列数据的时间点，所述新增的数据行的第一个存储区所填入的数据为所述时间序列数据的指标值。

在一些实施例中，所述时间序列数据还包括：数据来源主体标识码信息，其中，所述数据来源主体标识码信息为所述时间序列数据的来源主体的标识码。

在一些实施例中，所述每条数据行的主键值还包括数据来源主体标识码，所述数据来源主体标识码为所述数据行的指标值数据的来源主体的标识码。

在一些实施例中，所述根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行，包括：根据所述时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码的数据行。

在一些实施例中，以及所述新增的数据行的主键值还包括所述时间序列数据的数据来源主体标识码。

在一些实施例中，所述时间序列数据还包括：指标标识码信息，所述指标标识码为所述时间序列数据的指标值所对应的指标的标识码。

在一些实施例中，所述每条数据行的主键值还包括指标标识码，所述指标标识码为所述数据行记录的指标值所对应的指标的标识码。

在一些实施例中，所述根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行，包括：根据所述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码和指标标识码的数据行。

在一些实施例中，所述新增的数据行的主键值还包括所述时间序列数据的指标标识码。

在一些实施例中，所述时间区间数据表还包括指标值数据集合列，用于记录所述至少一个时间点的指标值。

在一些实施例中，所述指标值数据集合列还用于记录存储区状态信息，所述时间区间数据表中的每条数据行中的所述存储区状态信息包括：所述数据行中的各存储区的空置状态，所述空置状态表示所述存储区是否填有数据；以及所述将没有填入数据的存储区进行数据压缩处理，包括：将存储区状态为“空闲”的存储区进行数据压缩处理。

第二方面，本申请提供了一种存储时间序列数据的装置，所述装置包括：数据存储单元，用于根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；数据压缩单元，用于将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；数据写入单元，用于将所述时间区间压缩数据写入磁盘。

在一些实施例中，所述数据存储单元包括：数据行匹配子单元，用于根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行；数据填入子单元，用于在匹配到所述对应的数据行时，将所述时间序列数据的指标值填入所述数据行中与所述时间点对应的存储区中；数据新增子单元，用于在没有匹配到所述数据行时，新增一条新数据行，所述新增的数据行的主键值包括所述时间序列数据的时间点，所述新增的数据行的第一个存储区所填入的数据为所述时间序列数据的指标值。

在一些实施例中，所述数据行匹配子单元进一步配置用于根据所述时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码的数据行。

在一些实施例中，所述新增的数据行的主键值还包括所述时间序列数据的数据来源主体标识码。

在一些实施例中，所述数据行匹配子单元进一步配置用于根据所述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码和指标标识码的数据行。

在一些实施例中，所述指标值数据集合列还用于记录存储区状态信息，所述时间区间数据表中的每条数据行中的所述存储区状态信息包括：所述数据行中的各存储区的空置状态，所述空置状态表示所述存储区是否填有数据；以及所述数据压缩单元进一步配置用于将存储区状态为“空闲”的存储区进行数据压缩处理。

本申请提供的存储时间序列数据的方法和装置，通过在将数据写入磁盘之前，将没有填入数据的存储区进行数据压缩处理，减少了磁盘存储空间的占用以及后续读写数据时的IO流量。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的存储时间序列数据的方法的一个实施例的流程图；

图3a是根据本实施例的存储时间序列数据的方法存储的数据在内存的存储结构示意图；

图3b是根据本实施例的存储时间序列数据的方法存储的数据在磁盘的存储结构示意图；

图4是根据本申请的存储时间序列数据的方法的另一个实施例的流程图；

图5是根据本申请的存储时间序列数据的装置的一个实施例的结构示意图；

图6是适于用来实现本申请实施例的存储时间序列数据的方法或装置的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的存储时间序列数据的方法或装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

终端设备101、102、103通过网络104与服务器105交互，以接收或发送数据等。终端设备101、102、103上可以安装有各种客户端应用(例如电脑管家应用等)以及各种监测设备，例如监测终端的CPU占用、内存占用等的设备。

终端设备101、102、103可以是各种电子设备，包括但不限于数据采集设备、智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上的电脑管家类应用等提供支持的数据库服务器或云服务器。服务器可以对接收到的数据进行存储、分析等处理，并将处理结果反馈给终端设备。

需要说明的是，本申请实施例所提供的存储时间序列数据的方法通常由服务器105执行。相应地，存储时间序列数据的装置可以设置于服务器105中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，图2示出了本申请的存储时间序列数据的方法的一个实施例的流程图。

如图2所示，本申请的存储时间序列数据的方法的流程200包括以下步骤：

步骤201，根据时间序列数据的时间点，将该时间序列数据的指标值存入时间区间数据表中。

其中，上述时间序列数据包括以下信息：时间点、与上述时间点关联的指标值。上述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，上述至少一个时间点中各个时间点之间相隔预定的时间长度，每个上述时间点占用内存的一个存储区，每个上述存储区包括预定个数的字节，每个上述时间点所关联的指标值被填入上述时间点所占用的存储区中。

在本实施例中，上述时间区间数据表包括主键列，上述时间区间数据表中的每条数据行的主键值可以包括表示上述数据行对应的时间区间的起点的起始时间点值。例如，时间区间数据表中的部分数据行的主键值可以表示为：

主键	…
timestamp0000	…

timestamp3600	…
timestamp7200	…

上表中，每一行记录时间长度为3600秒(即1小时)的时间区间的数据。主键值为“timestamp3600”的数据行记录的就是第3600秒到第7200秒之间(即第二个小时)的各时间点所关联的指标值。

相应地，存储时间序列数据的方法运行于其上的服务器可以根据上述时间序列数据的时间点，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间所对应的数据行；如果匹配到上述对应的数据行，则将上述时间序列数据的指标值填入上述数据行中与上述时间点对应的存储区中；如果没有匹配到上述数据行，则新增一条新数据行，上述新增的数据行的主键值包括上述时间序列数据的时间点，上述新增的数据行的第一个存储区所填入的数据为上述时间序列数据的指标值。

其中，上述至少一个时间点的指标值可以存储于上述时间区间数据表的一个列中。于是，上述时间区间数据表还可以包括指标值数据集合列，用于记录上述至少一个时间点的指标值。例如，时间区间数据表中的部分数据行可以表示为：

上表中，关于主键列中的数据可参考上述对主键列的说明，指标值数据集合列中的每个子列表示一个存储区，指标值数据集合列可以包括多个存储区，每个存储区对应一个时间点，各相邻的存储区对应的时间点之间相隔相等的时间长度。

在一些实现方式中，时间区间数据表还可以包括时间间隔列，用于记录上述相邻的存储区对应的时间点之间相隔的时间长度。

根据上述将该时间序列数据的指标值存入时间区间数据表中的方法，通过将一段时间区间的多个时间点所关联的指标值存在一条数据行中，极大地减少了存储时间序列数据所需的行数，减少了存储空间的占用。

步骤202，将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据。

在本实施例中，如果使用上述指标值数据集合列来记录上述至少一个时间点的指标值。该指标值数据集合列还可以用于记录存储区状态信息，时间区间数据表中的每条数据行中的存储区状态信息包括：该数据行中的各存储区的空置状态。其中，空置状态表示上述存储区是否填有数据。例如，假设一条数据行中包括4个存储区，存储区状态信息的值可以为：“1101”。该值就表示该数据行中第三个存储区为空置状态。

相应地，步骤202可以包括：将存储区状态为“空闲”的存储区进行数据压缩处理。

步骤203，将上述时间区间压缩数据写入磁盘。

在本实施例中，上述存入上述时间区间数据表中的数据被存在内存中的存储区中，经过步骤202的处理，上述数据在内存中占用的存储空间已大大减少，服务器再将处理后的时间区间压缩数据写入磁盘。

继续参见图3a和图3b，图3a是根据本实施例的存储时间序列数据的方法存储的数据在内存的存储结构示意图，图3b是根据本实施例的存储时间序列数据的方法存储的数据在磁盘的存储结构示意图。通过图3a和图3b，可以看出时间序列数据在磁盘中所占用的存储空间相比其在内存所占用的存储空间要减少很多。

本申请提供的存储时间序列数据的方法，通过在将数据写入磁盘之前，将没有填入数据的存储区进行数据压缩处理，减少了磁盘存储空间的占用以及后续读写数据时的IO流量。

下面参考图4，图4示出了本申请的存储时间序列数据的方法的另一个实施例的流程图。

如图4所示，本申请的存储时间序列数据的方法的流程400包括以下步骤：

步骤401，根据时间序列数据的时间点，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间所对应的数据行。

其中，上述时间序列数据包括以下信息：时间点、与上述时间点关联的指标值以及主体标识码信息；其中，上述数据来源主体标识码信息为上述时间序列数据的来源主体的标识码。上述时间区间数据表中的每条数据行用于记录一个数据来源主体在预定长度的时间区间内的至少一个时间点所关联的指标值，上述至少一个时间点中各个时间点之间相隔预定的时间长度，每个上述时间点占用内存的一个存储区，每个上述存储区包括预定个数的字节，每个上述时间点所关联的指标值被填入上述时间点所占用的存储区中。

上述时间区间数据表包括主键列以及指标值数据集合列。其中，上述时间区间数据表中的每条数据行的主键值包括表示上述数据行对应的时间区间的起点的起始时间点值以及数据来源主体标识码，上述数据来源主体标识码为上述数据行的指标值数据的来源主体的标识码；上述指标值数据集合列用于记录上述至少一个时间点的指标值。例如，Instance1表示机器A，主键值为“Instance1_timestamp3600”的这一行的数据所记录的就是机器A在第二个小时中各时间点所关联的指标值。

基于上述时间序列数据和时间区间数据表的数据结构。步骤401具体为：根据时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间并且主键值包括上述时间序列数据的数据来源主体标识码的数据行。

根据本实施例的上述将该时间序列数据的指标值存入时间区间数据表中的方法，通过将一个数据来源主体在一个时间区间内的多个时间点所关联的指标值存在一条数据行中，极大地减少了存储时间序列数据所需的行数，减少了存储空间的占用。

步骤402，如果匹配到上述对应的数据行，则将上述时间序列数据的指标值填入上述数据行中与上述时间点对应的存储区中。

例如，上述时间序列数据的数据来源主体标识码为“Instance1”，时间地点为第7100秒，指标值为0.97，则将其存入时间区间数据表后，匹配到的数据行的主键值为“Instance1_timestamp3600”，假设该数据行中各存储区之间相隔100秒，则该数据行的指标值数据集合列一共有36个存储区。于是，在此将0.97填入第36个存储区中。

步骤403，如果没有匹配到上述数据行，则新增一条新数据行。

在本实施例中，上述新增的数据行的主键值包括上述时间序列数据的时间点，以及上述时间序列数据的数据来源主体标识码，上述新增的数据行的第一个存储区所填入的数据为上述时间序列数据的指标值。例如：上述时间序列数据的数据来源主体标识码为“Instance1”，时间地点为第7200秒，指标值为0.97，则将其存入时间区间数据表后，新增的一条数据行的主键值可以为“Instance1_timestamp7200”，该数据行中第一个存储区所填入的数据为0.97。

步骤404，将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据。

在本实施例中，步骤404的具体处理可参考上述对图2所示实施例中步骤202的详细描述，在此不再赘述。

步骤405，将上述时间区间压缩数据写入磁盘。

在本实施例中，步骤405的具体处理可参考上述对图2所示实施例中步骤203的详细描述，在此不再赘述。

在本实施例的一些实现方式中，上述时间序列数据还可以包括：指标标识码信息，上述指标标识码为上述时间序列数据的指标值所对应的指标的标识码。例如，终端设备采集到的时间序列数据的指标值为机器A的CPU性能值，“CPU”就可以作为该时间序列数据的指标标识码。相应地，时间区间数据表中每条数据行的主键值还可以包括指标标识码，上述指标标识码为上述数据行记录的指标值所对应的指标的标识码。例如，一条数据行的主键值可以为“Instance1_timestamp3600_MEM”，表示该数据行所记录的数据为Instance1对应的机器在第2个小时的各个时间点的内存指标值。

基于该实现方式的数据结构，步骤402可以包括：根据上述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间并且主键值包括上述时间序列数据的数据来源主体标识码和指标标识码的数据行。以及，步骤403中新增的数据行的主键值还可以包括上述时间序列数据的指标标识码。

通过该实现方式，使得上述时间区间数据表的数据行进一步具有了指标标识码维度，从而能够存储并区分不同指标的数据。

从图4中可以看出，与图2对应的实施例相比，本实施例中的存储时间序列数据的方法中的时间序列数据和时间区间数据表具有了更多的维度，增加了数据来源主体维度，相应地，将时间序列数据存入时间区间数据表的步骤也做了相应的调整。由此，本实施例描述的方案可以存储并区分不同数据来源主体、甚至不同指标的数据。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种存储时间序列数据的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于服务器中。

如图5所示，本实施例上述的存储时间序列数据的装置500包括：数据存储单元501、数据压缩单元502以及数据写入单元503。其中，数据存储单元501，用于根据时间序列数据的时间点，将上述时间序列数据的指标值存入时间区间数据表中，其中，上述时间序列数据包括以下信息：时间点、与上述时间点关联的指标值，上述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，上述至少一个时间点中各个时间点之间相隔预定的时间长度，每个上述时间点占用内存的一个存储区，每个上述存储区包括预定个数的字节，每个上述时间点所关联的指标值被填入上述时间点所占用的存储区中；数据压缩单元502，用于将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；数据写入单元503，用于将上述时间区间压缩数据写入磁盘。

在本实施例中，上述时间区间数据表可以包括主键列，上述时间区间数据表中的每条数据行的主键值可以包括表示上述数据行对应的时间区间的起点的起始时间点值。数据存储单元501可以包括：

数据行匹配子单元5011，用于根据上述时间序列数据的时间点，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间所对应的数据行；

数据填入子单元5012，用于在匹配到上述对应的数据行时，将上述时间序列数据的指标值填入上述数据行中与上述时间点对应的存储区中；

数据新增子单元5013，用于在没有匹配到上述数据行时，新增一条新数据行，上述新增的数据行的主键值包括上述时间序列数据的时间点，上述新增的数据行的第一个存储区所填入的数据为上述时间序列数据的指标值。

其中，上述时间区间数据表还可以包括指标值数据集合列，用于记录上述至少一个时间点的指标值。

关于数据存储单元501的更具体的处理可参考图2对应实施例中步骤201的详细描述，在此不再赘述。

在本实施例中，如果数据存储单元501使用上述指标值数据集合列来记录上述至少一个时间点的指标值，该指标值数据集合列还用于记录存储区状态信息，上述时间区间数据表中的每条数据行中的上述存储区状态信息包括：上述数据行中的各存储区的编号、与上述编号对应的存储区的空置状态，上述空置状态表示上述存储区是否填有数据。以及数据压缩单元502可以进一步配置用于将存储区状态为“空闲”的存储区进行数据压缩处理。

关于数据压缩单元502的更具体的处理可参考图2对应实施例中步骤202的详细描述，在此不再赘述。

在本实施例中，数据写入单元503的具体处理可分别参考图2对应实施例中步骤203的详细描述，在此不再赘述。

在本实施例的一些实现方式中，上述时间序列数据还可以包括：数据来源主体标识码信息，其中，上述数据来源主体标识码信息为上述时间序列数据的来源主体的标识码。相应地，上述每条数据行的主键值还包括数据来源主体标识码，上述数据来源主体标识码为上述数据行的指标值数据的来源主体的标识码。上述数据行匹配子单元5011可以进一步配置用于根据上述时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间并且主键值包括上述时间序列数据的数据来源主体标识码的数据行；以及上述数据新增子单元5013新增的数据行的主键值还可以包括上述时间序列数据的数据来源主体标识码。

本实现方式中数据行匹配子单元5011以及数据新增子单元5013的具体处理可分别参考图4对应实施例中步骤401以及步骤403的详细描述，在此不再赘述。

在本实施例的一些实现方式中，上述时间序列数据还可以包括：指标标识码信息，上述指标标识码为上述时间序列数据的指标值所对应的指标的标识码。相应地，上述每条数据行的主键值还可以包括指标标识码，上述指标标识码为上述数据行记录的指标值所对应的指标的标识码。上述数据行匹配子单元5011可以进一步配置用于根据上述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含上述时间序列数据的时间点的时间区间并且主键值包括上述时间序列数据的数据来源主体标识码和指标标识码的数据行。以及上述数据新增子单元5013新增的数据行的主键值还可以包括上述时间序列数据的指标标识码。

本实现方式中数据行匹配子单元5011以及数据新增子单元5013的具体处理可分别参考图4对应实施例中的对应实现方式的详细描述，在此不再赘述。

本申请提供的存储时间序列数据的装置，通过数据压缩单元502在将数据写入磁盘之前，将没有填入数据的存储区进行数据压缩处理，减少了磁盘存储空间的占用以及后续读写数据时的IO流量。

本领域技术人员可以理解，上述存储时间序列数据的装置500还包括一些其他公知结构，例如处理器、存储器等，为了不必要地模糊本公开的实施例，这些公知的结构在图5中未示出。

下面参考图6，其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。

如图6所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括数据存储单元、数据压缩单元以及数据写入单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，数据存储单元还可以被描述为“存储时间序列数据的单元”。

作为另一方面，本申请还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质；也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备：根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；将所述时间区间压缩数据写入磁盘。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

一种存储时间序列数据的方法，其特征在于，所述方法包括：

根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；

将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；

将所述时间区间压缩数据写入磁盘。
根据权利要求1所述的方法，其特征在于，所述时间区间数据表包括主键列，所述时间区间数据表中的每条数据行的主键值包括表示所述数据行对应的时间区间的起点的起始时间点值。
根据权利要求2所述的方法，其特征在于，所述根据所述时间序列数据的时间，将所述时间序列数据的指标值存入时间区间数据表中，包括：

根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行；

如果匹配到所述对应的数据行，则将所述时间序列数据的指标值填入所述数据行中与所述时间点对应的存储区中；

如果没有匹配到所述数据行，则新增一条新数据行，所述新增的数据行的主键值包括所述时间序列数据的时间点，所述新增的数据行的第一个存储区所填入的数据为所述时间序列数据的指标值。
根据权利要求3所述的方法，其特征在于，所述时间序列数据还包括：数据来源主体标识码信息，其中，所述数据来源主体标识码信息为所述时间序列数据的来源主体的标识码。
根据权利要求4所述的方法，其特征在于，所述每条数据行的主键值还包括数据来源主体标识码，所述数据来源主体标识码为所述数据行的指标值数据的来源主体的标识码。
根据权利要求5所述的方法，其特征在于，所述根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行，包括：

根据所述时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码的数据行。
根据权利要求5所述的方法，其特征在于，所述新增的数据行的主键值还包括所述时间序列数据的数据来源主体标识码。
根据权利要求5所述的方法，其特征在于，所述时间序列数据还包括：指标标识码信息，所述指标标识码为所述时间序列数据的指标值所对应的指标的标识码。
根据权利要求8所述的方法，其特征在于，所述每条数据行的主键值还包括指标标识码，所述指标标识码为所述数据行记录的指标值所对应的指标的标识码。
根据权利要求9所述的方法，其特征在于，所述根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行，包括：

根据所述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码和指标标识码的数据行。
根据权利要求9所述的方法，其特征在于，所述新增的数据行的主键值还包括所述时间序列数据的指标标识码。
根据权利要求2-11任一所述的方法，其特征在于，所述时间区间数据表还包括指标值数据集合列，用于记录所述至少一个时间点的指标值。
根据权利要求12所述的方法，其特征在于，所述指标值数据集合列还用于记录存储区状态信息，所述时间区间数据表中的每条数据行中的所述存储区状态信息包括：所述数据行中的各存储区的空置状态，所述空置状态表示所述存储区是否填有数据；以及

所述将没有填入数据的存储区进行数据压缩处理，包括：将存储区状态为“空闲”的存储区进行数据压缩处理。
一种存储时间序列数据的装置，其特征在于，所述装置包括：

数据存储单元，用于根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；

数据压缩单元，用于将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；

数据写入单元，用于将所述时间区间压缩数据写入磁盘。
根据权利要求14所述的装置，其特征在于，所述时间区间数据表包括主键列，所述时间区间数据表中的每条数据行的主键值包括表示所述数据行对应的时间区间的起点的起始时间点值。
根据权利要求15所述的装置，其特征在于，所述数据存储单元包括：

数据行匹配子单元，用于根据所述时间序列数据的时间点，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间所对应的数据行；

数据填入子单元，用于在匹配到所述对应的数据行时，将所述时间序列数据的指标值填入所述数据行中与所述时间点对应的存储区中；

数据新增子单元，用于在没有匹配到所述数据行时，新增一条新数据行，所述新增的数据行的主键值包括所述时间序列数据的时间点，所述新增的数据行的第一个存储区所填入的数据为所述时间序列数据的指标值。
根据权利要求16所述的装置，其特征在于，所述时间序列数据还包括：数据来源主体标识码信息，其中，所述数据来源主体标识码信息为所述时间序列数据的来源主体的标识码。
根据权利要求17所述的装置，其特征在于，所述每条数据行的主键值还包括数据来源主体标识码，所述数据来源主体标识码为所述数据行的指标值数据的来源主体的标识码。
根据权利要求18所述的装置，其特征在于，所述数据行匹配子单元进一步配置用于根据所述时间序列数据的时间点以及数据来源主体标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码的数据行。
根据权利要求18所述的装置，其特征在于，所述新增的数据行的主键值还包括所述时间序列数据的数据来源主体标识码。
根据权利要求18所述的装置，其特征在于，所述时间序列数据还包括：指标标识码信息，所述指标标识码为所述时间序列数据的指标值所对应的指标的标识码。
根据权利要求21所述的装置，其特征在于，所述每条数据行的主键值还包括指标标识码，所述指标标识码为所述数据行记录的指标值所对应的指标的标识码。
根据权利要求22所述的装置，其特征在于，所述数据行匹配子单元进一步配置用于根据所述时间序列数据的时间点、数据来源主体标识码和指标标识码，在时间区间数据表中匹配包含所述时间序列数据的时间点的时间区间并且主键值包括所述时间序列数据的数据来源主体标识码和指标标识码的数据行。
根据权利要求22所述的装置，其特征在于，所述新增的数据行的主键值还包括所述时间序列数据的指标标识码。
根据权利要求15-24任一所述的装置，其特征在于，所述时间区间数据表还包括指标值数据集合列，用于记录所述至少一个时间点的指标值。
根据权利要求25所述的装置，其特征在于，所述指标值数据集合列还用于记录存储区状态信息，所述时间区间数据表中的每条数据行中的所述存储区状态信息包括：所述数据行中的各存储区的空置状态，所述空置状态表示所述存储区是否填有数据；以及

所述数据压缩单元进一步配置用于将存储区状态为“空闲”的存储区进行数据压缩处理。
一种设备，包括：

处理器；和

存储器，

所述存储器中存储有能够被所述处理器执行的计算机可读指令，在所述计算机可读指令被执行时，所述处理器：

根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；

将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；

将所述时间区间压缩数据写入磁盘。
一种非易失性计算机存储介质，所述计算机存储介质存储有能够被处理器执行的计算机可读指令，当所述计算机可读指令被处理器执行时，所述处理器：

根据时间序列数据的时间点，将所述时间序列数据的指标值存入时间区间数据表中，其中，所述时间序列数据包括以下信息：时间点、与所述时间点关联的指标值，所述时间区间数据表中的每条数据行用于记录预定长度的时间区间内的至少一个时间点所关联的指标值，所述至少一个时间点中各个时间点之间相隔预定的时间长度，每个所述时间点占用内存的一个存储区，每个所述存储区包括预定个数的字节，每个所述时间点所关联的指标值被填入所述时间点所占用的存储区中；

将没有填入数据的存储区进行数据压缩处理，得到时间区间压缩数据；

将所述时间区间压缩数据写入磁盘。