CN114780530A

CN114780530A - 基于lsm树键值分离的时序数据存储方法及系统

Info

Publication number: CN114780530A
Application number: CN202210486592.7A
Authority: CN
Inventors: 李涛; 辛越; 管延信
Original assignee: Shandong Inspur Science Research Institute Co Ltd
Current assignee: Shanghai Yunxi Technology Co ltd
Priority date: 2022-05-06
Filing date: 2022-05-06
Publication date: 2022-07-22

Abstract

本发明公开基于LSM树键值分离的时序数据存储方法及系统，涉及数据存储技术领域；利用键值分开存储的方式，将键存储到基于LSM树的有序索引中，将值存储到基于顺序添加到键值日志文件中，实现了快速范围查询的功能，解决现有键值存储系统读、写操作延迟高，数据量较大时产生的读、写以及空间放大等问题，同时使用基于探测的压缩算法高效清理LSM树中的过期索引，避免现有系统中LSM树压缩效率低导致索引累积而引发的各种性能问题，并根据构建的全量前缀删除统计表，利用表中索引键的前缀和元数据中定义的删除时间能够在键值日志文件清理垃圾数据时减少对有序索引的随机查询，解决现有存储系统垃圾数据清理效率低下等问题且不消耗更多资源。

Description

基于LSM树键值分离的时序数据存储方法及系统

技术领域

本发明公开方法及系统，涉及数据存储技术领域，具体地说是基于LSM树键值分离的时序数据存储方法及系统。

背景技术

在物联网领域，时序数据具有采集频率快、数据量大、结构化等特点。在物联网系统中采集的时序数据通常又具有多个属性，而时序数据存储系统需要能够根据用户的各种查询需求快速的完成数据的查找。

目前可以使用LSM树作为基础的数据存储结构。由于索引与数据分开存储，过期索引的清理可以在LSM树的压缩中完成，但LSM树的压缩算法存在缺陷使得LSM树容易过度膨胀，虽然后续版本中LSM树的压缩算法得到改进，但依旧容易积累大量的过期索引，导致查询性能大幅下降。同时分布式数据库中过期数据的清理需要借助索引，进一步导致清理效率低下，并且系统长时间运行产生较多的垃圾数据，占用了大量磁盘空间。

发明内容

本发明针对现有技术的问题，提供基于LSM树键值分离的时序数据存储方法及系统，本发明提出的具体方案是：

基于LSM树键值分离的时序数据存储方法，基于LSM树键值分离方式，根据写请求将分布式数据库写入的键值数据封装成键值条目，所述键值条目包含索引键和元数据，所述元数据包含时间戳和标签，

根据所述元数据中标签判断所述键值条目是否为索引键的删除标记，若是则将索引键的前缀和元数据中定义的删除时间构成一对键值，放入全量前缀删除统计表，将所述键值条目写入到键值存储日志，并利用所述索引键、所述元数据以及所述键值条目在键值存储日志中的地址构造索引条目，将索引条目写入到跳表的排序字符串表中，相邻层跳表间根据排序字符串表的重合数据进行合并，判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，并判断层级较大的跳表是否为非空的最深层，若均为是则丢弃所述索引条目；

根据读请求中索引键与时间戳，查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，若未被删除则查找索引条目，根据查找到的索引条目按照读请求判断是否返回键值条目，

根据清理请求，遍历最旧的键值存储日志的所有键值条目，根据全量前缀删除统计表记录的索引键的前缀和删除时间，判断所述最旧的键值存储日志是否需要保留，根据判断结果清理键值存储日志或将键值存储日志重新写入分布式数据库。

进一步，所述的基于LSM树键值分离的时序数据存储方法中所述判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，若否则保留所述索引条目，将所述索引条目写入新的排序字符串表，

若是则判断层级较大的跳表是否为非空的最深层，若否则保留所述索引条目，将所述索引条目写入新的排序字符串表。

进一步，所述的基于LSM树键值分离的时序数据存储方法中将索引键的前缀和删除时间构成的键值对放入全量前缀删除统计表，包括：

将索引键的前缀和删除时间构成的键值对，写入前缀删除统计表，

并根据写请求将全部键值条目写入到键值存储日志后，将前缀删除统计表与全量前缀删除统计表进行合并。

进一步，所述的基于LSM树键值分离的时序数据存储方法中所述查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，包括：

根据全量前缀删除统计表，确认时间戳对应的索引键已经被删除，则返回空给上层应用，

根据全量前缀删除统计表，时间戳对应的索引键未被删除则在存储索引条目的跳表中查找索引条目。

进一步，所述的基于LSM树键值分离的时序数据存储方法中所述判断所述最旧的键值存储日志是否需要保留，包括：

根据索引键的前缀和删除时间，确认所述最旧的键值存储日志不需要保留，则清理键值存储日志，

根据索引键的前缀和删除时间，确认所述最旧的键值存储日志需要保留，则将键值存储日志重新写入分布式数据库。

本发明还提供基于LSM树键值分离的时序数据存储系统，包括前置统计模块、键值存储模块和有序索引模块，

键值存储模块基于LSM树键值分离方式，根据写请求将分布式数据库写入的键值数据封装成键值条目，所述键值条目包含索引键和元数据，所述元数据包含时间戳和标签，

前置统计模块根据所述元数据中标签判断所述键值条目是否为索引键的删除标记，若是则将索引键的前缀和元数据中定义的删除时间构成一对键值，放入全量前缀删除统计表，键值存储模块将所述键值条目写入到键值存储日志，

有序索引模块利用所述索引键、所述元数据以及所述键值条目在键值存储日志中的地址构造索引条目，将索引条目写入到跳表的排序字符串表中，相邻层跳表间根据排序字符串表的重合数据进行合并，判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，并判断层级较大的跳表是否为非空的最深层，若均为是则丢弃所述索引条目；

前置统计模块根据读请求中索引键与时间戳，查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，若未被删除则查找索引条目，根据查找到的索引条目按照读请求判断是否返回键值条目，

根据清理请求，遍历最旧的键值存储日志的所有键值条目，根据全量前缀删除统计表记录的索引键的前缀和删除时间，判断所述最旧的键值存储日志是否需要保留，根据判断结果键值存储模块清理键值存储日志或将键值存储日志重新写入分布式数据库。

进一步，所述的基于LSM树键值分离的时序数据存储系统中所述有序索引模块判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，若否则保留所述索引条目，将所述索引条目写入新的排序字符串表，

进一步，所述的基于LSM树键值分离的时序数据存储系统中前置统计模块将索引键的前缀和删除时间构成的键值对放入全量前缀删除统计表，包括：

进一步，所述的基于LSM树键值分离的时序数据存储系统中所述前置统计模块查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，包括：

进一步，所述的基于LSM树键值分离的时序数据存储系统中前置统计模块判断所述最旧的键值存储日志是否需要保留，包括：

根据索引键的前缀和删除时间，确认所述最旧的键值存储日志不需要保留，则键值存储模块清理键值存储日志，

根据索引键的前缀和删除时间，确认所述最旧的键值存储日志需要保留，则键值存储模块将键值存储日志重新写入分布式数据库。

本发明的有益之处是：

本发明提供基于LSM树键值分离的时序数据存储方法，实现了分布式数据库系统的存储优化。利用键值分开存储的方式，将键存储到基于LSM树的有序索引中，将值(数据)存储到基于顺序添加到键值日志文件中有序索引实现了快速范围查询的功能，顺序添加实现了随机写到顺序写的转变，解决现有键值存储系统读、写操作延迟高，数据量较大时产生的读、写以及空间放大等问题，同时使用基于探测的压缩算法能够高效地将LSM树中的过期索引快速清理掉，解决现有系统中LSM树压缩效率低导致索引累积而引发的各种性能问题，并根据构建的全量前缀删除统计表，利用表中索引键的前缀和元数据中定义的删除时间能够在键值日志文件清理垃圾数据时减少对有序索引的随机查询，解决现有存储系统垃圾数据清理效率低下的问题并且不会消耗更多的资源。

附图说明

图1是利用本发明进行数据写入的流程示意图。

图2是利用本发明进行数据存储的方式示意图。

图3是本发明系统数据读取流程示意图。

图4是利用本发明进行索引条目数据合并流程示意图。

图5是本发明中跳表的数据合并形式示意图。

图6是利用本发明进行数据清理流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

本发明方法基于LSM树键值分离的时序数据存储方法，基于LSM树键值分离方式，根据写请求将分布式数据库写入的键值数据封装成键值条目，所述键值条目包含索引键和元数据，所述元数据包含时间戳和标签，

本发明方法利用键值分开存储的方式，将键存储到基于LSM树的有序索引中，将值存储到基于顺序添加到键值日志文件中，实现了快速范围查询的功能，解决现有键值存储系统读、写操作延迟高，数据量较大时产生的读、写以及空间放大等问题，同时使用基于探测的压缩算法高效清理LSM树中的过期索引，避免现有系统中LSM树压缩效率低导致索引累积而引发的各种性能问题，并根据构建的全量前缀删除统计表，利用表中索引键的前缀和元数据中定义的删除时间能够在键值日志文件清理垃圾数据时减少对有序索引的随机查询，解决现有存储系统垃圾数据清理效率低下等问题且不消耗更多资源。

具体应用中，在本发明方法的一些实施例中，进行基于LSM树键值分离的时序数据存储时，参考图1写入流程，上层应用通过接口层将写请求发到键值存储的数据库系统，通过数据库系统将写入的键值数据封装成键值条目，该键值条目中包含索引键、索引值以及元数据，元数据中包含时间戳、标签以及其他用户自定义的属性，通过数据库系统根据键值条目元数据中标签，判断该条目是否为索引键的删除标记。如果是删除标记，需要将该键值条目中索引键的前缀以及元数据中用户定义的删除时间点取出构成一对键值，写入到全量前缀删除统计表，当全量前缀删除统计表中的写入或更新操作达到设定阈值，将整个全量前缀删除统计表进行持久化存储，

键值条目写入到键值存储日志后，利用索引键、元数据以及键值条目在键值存储日志中的地址构造索引条目，再将索引条目写入到跳表中。

进一步地，可以将索引键的前缀以及元数据中用户定义的删除时间点构成的键值对，写入到字典结构的前缀删除统计表中，当此次写入操作包含的全部键值条目成功以追加的方式写入到键值存储日志后，随即将对应的前缀删除统计表发送到异步处理的队列中，由线程取出前缀删除统计表与全量前缀删除统计表进行合并，当全量前缀删除统计表中的写入或更新操作达到设定阈值，将整个全量前缀删除统计表进行持久化存储。

进一步地，将索引条目写入到跳表中，可以当跳表超过设定的大小时，再转变为只读跳表；当内存中的只读跳表超过了设定数量，将只读跳表中的数据按照字典序写入到0层跳表的排序字符串表中；当0层跳表的排序字符串表超过设定数量后，将0层的多个排序字符串表合并生成更大的排序字符串表写入到1层跳表并进行落盘。同理，当1层跳表的排序字符串表超过设定大小后，将1层跳表的多个排序字符串表合并生成更大的排序字符串表写入到2层并进行落盘，更高层的合并操作与之类似。只有0层跳表的排序字符串表之间的数据会有重叠，1层或更高层的同层排序字符串表之间的数据不会有重叠。

上述涉及到的键值存储与索引条目存储的结构如图2所示。无论是键值日志文件的落盘还是索引条目文件的落盘都会被记录并同步落盘，避免因故障宕机引起数据丢失。

进一步地，键值存储时通过数据库系统进行索引条目的数据合并时，流程如图4和图5，其中0层的排序字符串表的默认数量为5，0层不限制大小，1层默认大小为64MB，之后每层扩大10倍，可以设置最大容量超过6TB，数据合并按照层来进行，在合并开始前先计算各层中排序字符串表总的实际大小与各层额定大小的比值，比值超过1的层参与合并。首先从下一层(如2层)中选取一个与当前层中各表重合度最高的排序字符串表记为下层表，再从当前层(如1层)中选取出所有与下层表重叠的排序字符串表记为上层表，然后利用归并排序将上层表和下层表进行合并，此过程中保留每条索引键对应的最新版本的键值条目，如果合并过程中发现上层表中存在索引条目有删除标记，且下层表所在层级的更高层级上不存在排序字符串表，则丢弃该索引条目。如通过上述合并流程能够高效的清理已删除的索引数据。

基于LSM树键值分离的时序数据存储时，参考图3的读取流程，上层应用通过接口层将读请求发到键值存储的数据库系统，通过数据库系统根据读请求中的索引键与时间戳，在全局前缀删除表中进行查询，如果判断时间戳对应索引键已经被删除，则直接返回空给上层应用；如果判断时间戳对应索引键未被删除，则进行索引条目查找。在内存中的跳表中进行索引条目查找，如果在跳表中找到则直接返回给上层应用，如果在跳表中没有找到，则继续在0层的排序字符串表中进行查找，以此类推直到找到待查询的索引条目。找到索引条目后，根据读请求的详细内容判断是否需要返回键值条目，如果需要则根据索引条目中地址到对应的键值日志文件中读取键值条目，读取成功后将数据返回。

基于LSM树键值分离的时序数据存储时，参考图6的数据清理流程，上层应用通过接口层将清理请求发到键值存储的数据库系统。通过数据库系统首先拷贝全量前缀删除统计表，然后找到文件编号最小(最旧)的键值日志文件，依次遍历文件中的所有键值条目，根据全量前缀删除统计表中所记录表的前缀以及对应的删除时间戳，判断日志条目是否需要保留，若不需要则直接跳过，若需要则重新执行写入流程。另外，键值日志文件序号是全局递增，并且不会被复用。键值日志文件清理完毕后可以将操作过程与结果记录进行持久化存储，避免发生数据丢失。

本发明还提供基于LSM树键值分离的时序数据存储装置，包括前置统计模块、键值存储模块和有序索引模块，

根据清理请求，遍历最旧的键值存储日志的所有键值条目，根据全量前缀删除统计表记录的索引键的前缀和删除时间，判断所述最旧的键值存储日志是否需要保留，根据判断结果键值存储模块清理键值存储日志或将键值存储日志重新写入。

上述系统内的各模块之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

同样地，本发明系统实现了分布式数据库系统的存储优化。利用键值分开存储的方式，将键存储到基于LSM树的有序索引中，将值(数据)存储到基于顺序添加到键值日志文件中有序索引实现了快速范围查询的功能，顺序添加实现了随机写到顺序写的转变，解决现有键值存储系统读、写操作延迟高，数据量较大时产生的读、写以及空间放大等问题，同时使用基于探测的压缩算法能够高效地将LSM树中的过期索引快速清理掉，解决现有系统中LSM树压缩效率低导致索引累积而引发的各种性能问题，并根据构建的全量前缀删除统计表，利用表中索引键的前缀和元数据中定义的删除时间能够在键值日志文件清理垃圾数据时减少对有序索引的随机查询，解决现有存储系统垃圾数据清理效率低下的问题并且不会消耗更多的资源。

需要说明的是，上述各流程和各系统结构中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构，也可以是逻辑结构，即，有些模块可能由同一物理实体实现，或者，有些模块可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims

1.基于LSM树键值分离的时序数据存储方法，其特征是基于LSM树键值分离方式，根据写请求通过分布式数据库将写入的键值数据封装成键值条目，所述键值条目包含索引键和元数据，所述元数据包含时间戳和标签，

根据所述元数据中标签判断所述键值条目是否存在索引键的删除标记，若是则将索引键的前缀和所述元数据中定义的删除时间构成一对键值，放入全量前缀删除统计表，

将所述键值条目写入到键值存储日志，利用所述索引键、所述元数据以及所述键值条目在键值存储日志中的地址构造索引条目，将索引条目写入到跳表的排序字符串表中，相邻层跳表间根据排序字符串表的重合数据进行合并，判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，并判断层级较大的跳表是否为非空的最深层，若均为是则丢弃所述索引条目；

根据读请求中索引键与时间戳，查询全量前缀删除统计表，判断读请求中时间戳对应的索引键是否被删除，若未被删除则查找索引条目，根据查找到的索引条目按照读请求判断是否返回键值条目；

2.根据权利要求1所述的基于LSM树键值分离的时序数据存储方法，其特征是所述判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，若否则保留所述索引条目，将所述索引条目写入新的排序字符串表，

3.根据权利要求1所述的基于LSM树键值分离的时序数据存储方法，其特征是将索引键的前缀和删除时间构成的键值对放入全量前缀删除统计表，包括：

4.根据权利要求1所述的基于LSM树键值分离的时序数据存储方法，其特征是所述查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，包括：

5.根据权利要求1所述的基于LSM树键值分离的时序数据存储方法，其特征是所述判断所述最旧的键值存储日志是否需要保留，包括：

6.基于LSM树键值分离的时序数据存储系统，其特征是包括前置统计模块、键值存储模块和有序索引模块，

7.根据权利要求6所述的基于LSM树键值分离的时序数据存储系统，其特征是所述有序索引模块判断相邻层跳表中层级较小的跳表的排序字符串表所存储的索引条目是否存在删除标记，若否则保留所述索引条目，将所述索引条目写入新的排序字符串表，

8.根据权利要求6所述的基于LSM树键值分离的时序数据存储系统，其特征是前置统计模块将索引键的前缀和删除时间构成的键值对放入全量前缀删除统计表，包括：

9.根据权利要求6所述的基于LSM树键值分离的时序数据存储系统，其特征是所述前置统计模块查询全量前缀删除统计表，判断时间戳对应的索引键是否被删除，包括：

10.根据权利要求6所述的基于LSM树键值分离的时序数据存储系统，其特征是前置统计模块判断所述最旧的键值存储日志是否需要保留，包括：