CN115686385A - 一种数据存储方法、装置、计算机设备及存储介质 - Google Patents
一种数据存储方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN115686385A CN115686385A CN202310001206.5A CN202310001206A CN115686385A CN 115686385 A CN115686385 A CN 115686385A CN 202310001206 A CN202310001206 A CN 202310001206A CN 115686385 A CN115686385 A CN 115686385A
- Authority
- CN
- China
- Prior art keywords
- data
- pool
- cache pool
- read
- write
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000013500 data storage Methods 0.000 title claims abstract description 18
- 230000004044 response Effects 0.000 claims abstract description 38
- 230000000593 degrading effect Effects 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 38
- 238000013467 fragmentation Methods 0.000 claims description 33
- 238000006062 fragmentation reaction Methods 0.000 claims description 33
- 239000012634 fragment Substances 0.000 claims description 21
- 230000004048 modification Effects 0.000 claims description 14
- 238000012986 modification Methods 0.000 claims description 14
- 239000007787 solid Substances 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 229940086299 hot spot Drugs 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及存储技术领域,具体公开了一种数据存储方法、装置、计算机设备及存储介质,该方法应用于分布式存储系统,分布式存储系统包括缓存池和数据池,方法包括:根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;按第二周期获取数据的存储位置,并判断数据对应的数据热度是否大于预设值;响应于数据对应的数据热度大于预设值并且数据存储于数据池,将数据从数据池读出并写入缓存池;响应于数据对应的数据热度不大于预设值并且数据存储于缓存池,将数据从缓存池移除。通过本发明的方案,在相同存储节点数量的情况下提高了分布式存储系统的存储容量,并降低了延迟;同时还提高了缓存池的命中率。
Description
技术领域
本发明涉及存储技术领域,尤其涉及一种数据存储方法、装置、计算机设备及存储介质。
背景技术
面对海量爆发的数据,传统集中式存储系统已经不是最优选了,现在更多是采用分布式存储系统来存储海量爆发的数据。分布式存储系统,采用Scale-out(横向扩展)架构,可实现超大集群规模的部署,从3节点存储集群起步,可实现灵活地扩展至数千节点。存储容量可实现一个集群EB(Exa Byte,艾字节,一种存储单位)级数据空间。同时由于分布式架构,每一个存储节点都可以提供独立的性能支撑,在高并发的数据处理中,可以实现更高的存储性能,更高的带宽吞吐和IOPS(Input/Output Operations Per Second,每秒的读写次数),有效地解决了海量数据高扩展和高性能的存储需求。
为了应对海量存储空间需求我们需要单个存储节点支持更大的存储能力,并且持久化存储器的性能可以满足业务场景需求。由于标准存储服务器节点的机箱空间有限,为了使单个存储服务器节点拥有最大的存储空间,在盘位有限的情况下通常采用普通机械盘来满足容量的需求。普通机械盘具有同容量价格低、数据易恢复的优势,普通机械盘容量一般为3-6T容量,其缺点是随机访问性能较低。
发明内容
有鉴于此,本发明提出了一种数据存储方法、装置、计算机设备及存储介质,为了提高分布式存储系统中单个存储节点的容量上限,采用由叠瓦盘组成的数据池;并且通过采用由NVME固态硬盘组成的缓存池来降低分布式存储系统的读写数据延迟;并且还通过对数据热度的检测,提高了缓存池的命中率。
基于上述目的,本发明实施例的一方面提供了一种数据存储方法,应用于分布式存储系统,所述分布式存储系统包括缓存池和数据池,方法具体包括如下步骤:
根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
在一些实施方式中,方法还包括:
接收数据修改请求;
将所述数据修改请求路由到所述缓存池以将修改数据写入所述缓存池,并在元数据中标记所述修改数据的存储位置。
在一些实施方式中,将所述数据从所述缓存池移除包括:
判断所述数据是否为修改数据;
响应于所述数据为修改数据,则将所述数据从所述缓存池移除,并将所述数据写入所述数据池。
在一些实施方式中,方法还包括:
响应于所述数据不为修改数据,则将所述数据从所述缓存池移除。
在一些实施方式中,所述数据池由叠瓦盘组成。
在一些实施方式中,将所述数据写入所述数据池包括:
将所述数据写入叠瓦盘的zone。
在一些实施方式中,方法还包括:
基于碎片整理策略对叠瓦盘的zone进行整理。
在一些实施方式中,基于碎片整理策略对叠瓦盘的zone进行整理包括:
计算每个zone的碎片率;
判断所述碎片率是否达到碎片率阈值;
响应于所述碎片率达到所述碎片率阈值,将所述碎片率达到所述碎片率阈值的zone中的数据整理后写入空闲zone或正在执行任务的zone。
在一些实施方式中,计算每个zone的碎片率包括:
基于所述zone有效数据的数据量除以所述zone的容量,得到所述zone的碎片率。
在一些实施方式中,方法还包括:
接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理。
在一些实施方式中,所述读/写数据请求包括读/写元数据请求、读数据请求和写数据请求。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于接收到读/写元数据请求,将所述读/写元数据请求路由到所述缓存池进行处理;
响应于接收到读数据请求,将所述读数据请求路由到所述缓存池进行处理;
响应于接收到写数据请求,基于所述写数据请求中写数据的大小将所述写数据请求路由到所述缓存池或所述数据池进行处理。
在一些实施方式中,所述缓存池由NVME固态硬盘组成。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于有读/写数据请求路由到缓存池,基于spdk框架访问所述NVME固态硬盘。
在一些实施方式中,基于zone接口管理所述叠瓦盘的zone。
在一些实施方式中,基于文件系统管理所述叠瓦盘。
在一些实施方式中,所述文件系统包括bluestore。
本发明实施例的另一方面,还提供了一种数据存储装置,应用于分布式存储系统,所述分布式存储系统包括缓存池和数据池,装置包括:
设定模块,所述设定模块配置为根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
判断模块,所述判断模块配置为按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
所述判断模块还配置为响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
所述判断模块还配置为响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
本发明实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机程序,所述计算机程序由所述处理器执行时实现如下方法的步骤:
在一些实施方式中,方法还包括:
接收数据修改请求;
将所述数据修改请求路由到所述缓存池以将修改数据写入所述缓存池,并在元数据中标记所述修改数据的存储位置。
在一些实施方式中,将所述数据从所述缓存池移除包括:
判断所述数据是否为修改数据;
响应于所述数据为修改数据,则将所述数据从所述缓存池移除,并将所述数据写入所述数据池。
在一些实施方式中,方法还包括:
响应于所述数据不为修改数据,则将所述数据从所述缓存池移除。
在一些实施方式中,所述数据池由叠瓦盘组成。
在一些实施方式中,将所述数据写入所述数据池包括:
将所述数据写入叠瓦盘的zone。
在一些实施方式中,方法还包括:
基于碎片整理策略对叠瓦盘的zone进行整理。
在一些实施方式中,基于碎片整理策略对叠瓦盘的zone进行整理包括:
计算每个zone的碎片率;
判断所述碎片率是否达到碎片率阈值;
响应于所述碎片率达到所述碎片率阈值,将所述碎片率达到所述碎片率阈值的zone中的数据整理后写入空闲zone或正在执行任务的zone。
在一些实施方式中,计算每个zone的碎片率包括:
基于所述zone有效数据的数据量除以所述zone的容量,得到所述zone的碎片率。
在一些实施方式中,方法还包括:
接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理。
在一些实施方式中,所述读/写数据请求包括读/写元数据请求、读数据请求和写数据请求。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于接收到读/写元数据请求,将所述读/写元数据请求路由到所述缓存池进行处理;
响应于接收到读数据请求,将所述读数据请求路由到所述缓存池进行处理;
响应于接收到写数据请求,基于所述写数据请求中写数据的大小将所述写数据请求路由到所述缓存池或所述数据池进行处理。
在一些实施方式中,所述缓存池由NVME固态硬盘组成。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于有读/写数据请求路由到缓存池,基于spdk框架访问所述NVME固态硬盘。
在一些实施方式中,基于zone接口管理所述叠瓦盘的zone。
在一些实施方式中,基于文件系统管理所述叠瓦盘。
在一些实施方式中,所述文件系统包括bluestore。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如下方法步骤的计算机程序:
在一些实施方式中,方法还包括:
接收数据修改请求;
将所述数据修改请求路由到所述缓存池以将修改数据写入所述缓存池,并在元数据中标记所述修改数据的存储位置。
在一些实施方式中,将所述数据从所述缓存池移除包括:
判断所述数据是否为修改数据;
响应于所述数据为修改数据,则将所述数据从所述缓存池移除,并将所述数据写入所述数据池。
在一些实施方式中,方法还包括:
响应于所述数据不为修改数据,则将所述数据从所述缓存池移除。
在一些实施方式中,所述数据池由叠瓦盘组成。
在一些实施方式中,将所述数据写入所述数据池包括:
将所述数据写入叠瓦盘的zone。
在一些实施方式中,方法还包括:
基于碎片整理策略对叠瓦盘的zone进行整理。
在一些实施方式中,基于碎片整理策略对叠瓦盘的zone进行整理包括:
计算每个zone的碎片率;
判断所述碎片率是否达到碎片率阈值;
响应于所述碎片率达到所述碎片率阈值,将所述碎片率达到所述碎片率阈值的zone中的数据整理后写入空闲zone或正在执行任务的zone。
在一些实施方式中,计算每个zone的碎片率包括:
基于所述zone有效数据的数据量除以所述zone的容量,得到所述zone的碎片率。
在一些实施方式中,方法还包括:
接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理。
在一些实施方式中,所述读/写数据请求包括读/写元数据请求、读数据请求和写数据请求。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于接收到读/写元数据请求,将所述读/写元数据请求路由到所述缓存池进行处理;
响应于接收到读数据请求,将所述读数据请求路由到所述缓存池进行处理;
响应于接收到写数据请求,基于所述写数据请求中写数据的大小将所述写数据请求路由到所述缓存池或所述数据池进行处理。
在一些实施方式中,所述缓存池由NVME固态硬盘组成。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于有读/写数据请求路由到缓存池,基于spdk框架访问所述NVME固态硬盘。
在一些实施方式中,基于zone接口管理所述叠瓦盘的zone。
在一些实施方式中,基于文件系统管理所述叠瓦盘。
在一些实施方式中,所述文件系统包括bluestore。
本发明至少具有以下有益技术效果:一方面,在相同存储节点数量的情况下来提高分布式存储系统的存储容量,降低了延迟;另一方面,通过对数据热度的检测,提高了缓存池的命中率;又一方面,还实现了基于叠瓦盘使用方式的碎片整理与空闲空间回收;再一方面,通过采用spdk框架缩短了分布式存储软件读写NVMe固态硬盘上数据的输入输出路径,避免了用户态到内核态的数据拷贝开销,具备更低的延时。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的数据存储方法的一实施例的框图;
图2为本发明提供的数据存储装置的一实施例的示意图;
图3为本发明提供的计算机设备的一实施例的结构示意图;
图4为本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种数据存储方法的实施例,该方法应用于包括缓存池和缓存池的分布式存储系统,如图1所示,方法包括如下步骤:
S10、根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
S20、按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
S30、响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
S40、响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
具体的,本发明实施例应用于分布式存储系统,分布式存储系统包括缓存池和数据池,缓存池由NVME(non-volatile memory express,非易失性内存主机控制器接口规范)固态硬盘组成,数据池由叠瓦盘(Shingled Magnetic Recording,简称SMR)组成,以此在相同存储节点数量的情况下来提高分布式存储系统的存储容量,降低了缓存池的延迟。
根据访问次数设定数据热度hot_spot,数据热度会随着时间持续降低,热度降低到一定值数据变为冷数据。数据热度是变化的,例如,根据访问次数设定一数据的数据热度为10,之后每访问一次该数据,该数据的数据热度加1,同时每个设定的第一时间周期对该数据的数据热度减1。每个设定的第二时间周期对比数据热度与热度预设值hot_spot_threshold,并结合数据存储位置,实现数据在缓存池和数据池之间的迁移。如果数据池数据对应的数据热度大于预设值,将该数据调入缓存池,如果缓存池中数据对应的数据热度不大于预设值,将该数据从缓存池踢出去,如有需要回写到数据池。缓存池写回到数据池的冷数据,将写入叠瓦盘的顺序读写zone区域,由此提高了缓存池的命中率。
在一具体实施例中,如果缓存池水位达到水位上限,还可以将缓存池中的热度较低的热数据也将写回到数据池,直到缓存池水位达到安全水位,水位上限、安全水位均可以基于实际使用情况而自由设定。
在一些实施方式中,方法还包括:
接收数据修改请求;
将所述数据修改请求路由到所述缓存池以将修改数据写入所述缓存池,并在元数据中标记所述修改数据的存储位置。
在一具体实施例中,叠瓦盘通过将盘片上的数据磁道部分重叠,来提高磁盘存储密度,采用叠瓦盘作为分布式存储系统的数据盘,提高了分布式存储系统的存储能力。
叠瓦盘将磁道划分为若干个带(Band),即由连续磁道所构成的可连续写入区域,每个区域构成一个需要顺序写入的基本单元。Band是SMR盘上的物理概念,其对应的逻辑概念是zone(区域),一个zone的大小通常在256MB量级。由于叠瓦盘的特性,zone中的数据不能直接修改,对一个zone里的数据修改时需要将这个zone全部已写的数据读出再写入,比较耗时,因此本实施例中,通过将修改数据写入缓存池,并在元数据中标记修改数据的存储位置的方式,实现了zone中数据需要修改时,只实现全部擦除,无需再写入,提高了修改输入时的写入效率。
在一具体实施例中,叠瓦盘的读取操作与传统的机械硬盘一样,但是zone的随机写入性能非常差。因此,缓存池采用随机输入输出性能高的NVME SSD盘作为分布式存储系统中的缓存盘,很好的解决了zone的随机写入性能差的问题。
在一具体实施例中,为了提高性能,可以使用bluestore管理叠瓦盘,在实现zoneinterface,对于一个zone只实现全部擦除,不实现修改写。
bluestore是一个本地日志文件系统,作为对象存储后端,BlueStore在设计中便充分考虑了对SSD以及NVME的适配。针对FileStore(文件存储)的缺陷,BlueStore直接接管裸设备,直接进行对象数据IO操作,同时元数据存放在RocksDB(一种嵌入式、持久化存储的存储引擎),大大缩短了整个对象存储的IO路径。
在一些实施方式中,将所述数据从所述缓存池移除包括:
判断所述数据是否为修改数据;
响应于所述数据为修改数据,则将所述数据从所述缓存池移除,并将所述数据写入所述数据池。
在一些实施方式中,方法还包括:
响应于所述数据不为修改数据,则将所述数据从所述缓存池移除。
在一具体实施例中,根据访问次数设定数据热度,数据热度会随着时间持续降低,热度降低到一定值数据变为冷数据。对比数据热度与热度预设值,并结合数据存储位置,实现数据在缓存池和数据池之间的迁移。如果数据池数据对应的数据热度大于预设值,将该数据调入缓存池,如果缓存池中数据对应的数据热度不大于预设值,将该数据从缓存池踢出去,如有需要回写到数据池。缓存池写回到数据池的冷数据,将写入叠瓦盘的顺序读写zone区域,由此,提高了缓存池的命中率。有需要回写到数据池具体指的是修改数据,这部分数据写入时写在了缓存池,因此,如果其从缓存池移除时,要写入数据池。
在一些实施方式中,所述数据池由叠瓦盘组成。
在一些实施方式中,将所述数据写入所述数据池包括:
将所述数据写入叠瓦盘的zone。
在一具体实施例中,分布式文件系统由于数据池采用了叠瓦盘,由于叠瓦盘的zone的数据不能直接修改,如果有修改需求时,将修改后的数据写入高速缓存池,在元数据中将这部分数据标记存储位置为缓存池。经过一定时间后数据池中的数据盘上存在一部分zone,这些zone中有部分数据在缓存池有部分在数据池。
在一些实施方式中,方法还包括:
基于碎片整理策略对叠瓦盘的zone进行整理。
在一些实施方式中,基于碎片整理策略对叠瓦盘的zone进行整理包括:
计算每个zone的碎片率;
判断所述碎片率是否达到碎片率阈值;
响应于所述碎片率达到所述碎片率阈值,将所述碎片率达到所述碎片率阈值的zone中的数据整理后写入空闲zone或正在执行任务的zone。
在一些实施方式中,计算每个zone的碎片率包括:
基于所述zone有效数据的数据量除以所述zone的容量,得到所述zone的碎片率。
在一具体实施例中,在业务空闲时基于碎片整理策略对叠瓦盘的zone进行整理,具体过程如下:
计算zone的碎片率fragment_radio,计算方式为一个zone中有效数据的数据量除以zone的大小。当fragment_radio达到设定的fragment_radio_max时,将符合条件的多个碎片zone中的碎片数据整理后顺序写入空闲zone或者其他打开的zone的尾部,并释放碎片所在的zone空间。碎片率阈值fragment_radio_max,在不同业务场景和碎片率要求的部署中可以设定为不同的值,用来控制碎片率减少空间的浪费。
在一些实施方式中,方法还包括:
接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理。
在一些实施方式中,所述读/写数据请求包括读/写元数据请求、读数据请求和写数据请求。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于接收到读/写元数据请求,将所述读/写元数据请求路由到所述缓存池进行处理;
响应于接收到读数据请求,将所述读数据请求路由到所述缓存池进行处理;
响应于接收到写数据请求,基于所述写数据请求中写数据的大小将所述写数据请求路由到所述缓存池或所述数据池进行处理。
在一具体实施例中,分布式存储系统接收到客户端的请求后,基于请求类型将其路由到缓存池或者数据池进行处理。
具体的,对于读/写元数据请求,将读/写元数据请求路由到缓存池进行处理;对于读数据请求,将读数据请求路由到缓存池进行处理;对于写数据请求,基于写数据请求中写数据的大小将写数据请求路由到缓存池或数据池进行处理,具体为写数据请求设定IO(Input Output,输入输出)大小阈值,当写数据请求中写数据的大小大于IO大小阈值时,将该写数据请求路由到数据池处理,当写数据请求中写数据的大小不大于IO大小阈值时,将该写数据请求路由到缓存池处理。
在一些实施方式中,所述缓存池由NVME固态硬盘组成。
在一些实施方式中,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于有读/写数据请求路由到缓存池,基于spdk框架访问所述NVME固态硬盘。
在一具体实施例中,spdk框架是用户态(user space)、轮询(polled-mode)、异步(asynchronous)、无锁(lockless)的NVME驱动,其提供了零拷贝、高并发直接从用户态访问ssd的特性。本发明实施例使用spdk作为存储引擎加速访问缓存盘NVMe SSD。bluestore通过spdkd的uio驱动直接访问NVMe SSD,由此存储的数据不再需要从用户态内存拷贝到内核态,使用内核的nvme驱动与NVMe SSD设备交互,通过spdk的方式缩短了分布式存储软件读写NVMe SSD上数据的io路径,避免了用户态到内核态的数据拷贝开销,具备更低的延时。
在一些实施方式中,基于zone接口管理所述叠瓦盘的zone。
在一些实施方式中,基于文件系统管理所述叠瓦盘。
在一些实施方式中,所述文件系统包括bluestore。
基于同一发明构思,根据本发明的另一个方面,如图2所示,本发明的实施例还提供了一种数据存储装置,应用于分布式存储系统,所述分布式存储系统包括缓存池和数据池,装置包括:
设定模块110,所述设定模块110配置为根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
判断模块120,所述判断模块120配置为按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
所述判断模块120还配置为响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
所述判断模块120还配置为响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备30,在该计算机设备30中包括处理器310以及存储器320,存储器320存储有可在处理器上运行的计算机程序321,处理器310执行程序时执行如上的方法的步骤。
其中,存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的所述数据存储方法对应的程序指令/模块。处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行装置的各种功能应用以及数据处理,即实现上述方法实施例的数据存储方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质40,计算机可读存储介质40存储有被处理器执行时执行如上方法的计算机程序410。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (20)
1.一种数据存储方法,其特征在于,应用于分布式存储系统,所述分布式存储系统包括缓存池和数据池,方法包括:
根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
2.根据权利要求1所述的方法,其特征在于,还包括:
接收数据修改请求;
将所述数据修改请求路由到所述缓存池以将修改数据写入所述缓存池,并在元数据中标记所述修改数据的存储位置。
3.根据权利要求1所述的方法,其特征在于,将所述数据从所述缓存池移除包括:
判断所述数据是否为修改数据;
响应于所述数据为修改数据,则将所述数据从所述缓存池移除,并将所述数据写入所述数据池。
4.根据权利要求3所述的方法,其特征在于,还包括:
响应于所述数据不为修改数据,则将所述数据从所述缓存池移除。
5.根据权利要求3所述的方法,其特征在于,所述数据池由叠瓦盘组成。
6.根据权利要求5所述的方法,其特征在于,将所述数据写入所述数据池包括:
将所述数据写入叠瓦盘的zone。
7.根据权利要求6所述的方法,其特征在于,还包括:
基于碎片整理策略对叠瓦盘的zone进行整理。
8.根据权利要求7所述的方法,其特征在于,基于碎片整理策略对叠瓦盘的zone进行整理包括:
计算每个zone的碎片率;
判断所述碎片率是否达到碎片率阈值;
响应于所述碎片率达到所述碎片率阈值,将所述碎片率达到所述碎片率阈值的zone中的数据整理后写入空闲zone或正在执行任务的zone。
9.根据权利要求8所述的方法,其特征在于,计算每个zone的碎片率包括:
基于所述zone有效数据的数据量除以所述zone的容量,得到所述zone的碎片率。
10.根据权利要求1所述的方法,其特征在于,还包括:
接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理。
11.根据权利要求10所述的方法,其特征在于,所述读/写数据请求包括读/写元数据请求、读数据请求和写数据请求。
12.根据权利要求11所述的方法,其特征在于,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于接收到读/写元数据请求,将所述读/写元数据请求路由到所述缓存池进行处理;
响应于接收到读数据请求,将所述读数据请求路由到所述缓存池进行处理;
响应于接收到写数据请求,基于所述写数据请求中写数据的大小将所述写数据请求路由到所述缓存池或所述数据池进行处理。
13.根据权利要求10所述的方法,其特征在于,所述缓存池由NVME固态硬盘组成。
14.根据权利要求13所述的方法,其特征在于,接收读/写数据请求,并将所述读/写数据请求路由到缓存池或数据池进行处理包括:
响应于有读/写数据请求路由到缓存池,基于spdk框架访问所述NVME固态硬盘。
15.根据权利要求5所述的方法,其特征在于,基于zone接口管理所述叠瓦盘的zone。
16.根据权利要求5所述的方法,其特征在于,基于文件系统管理所述叠瓦盘。
17.根据权利要求16所述的方法,其特征在于,所述文件系统包括bluestore。
18.一种数据存储装置,其特征在于,应用于分布式存储系统,所述分布式存储系统包括缓存池和数据池,装置包括:
设定模块,所述设定模块配置为根据数据访问次数设定数据热度,并按第一周期对设定的数据热度进行降级;
判断模块,所述判断模块配置为按第二周期获取数据的存储位置,并判断所述数据对应的数据热度是否大于预设值;
所述判断模块还配置为响应于所述数据对应的数据热度大于所述预设值并且所述数据存储于所述数据池,将所述数据从所述数据池读出并写入所述缓存池;
所述判断模块还配置为响应于所述数据对应的数据热度不大于所述预设值并且所述数据存储于所述缓存池,将所述数据从所述缓存池移除。
19.一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1至17任意一项所述的方法的步骤。
20.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1至17任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310001206.5A CN115686385B (zh) | 2023-01-03 | 2023-01-03 | 一种数据存储方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310001206.5A CN115686385B (zh) | 2023-01-03 | 2023-01-03 | 一种数据存储方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115686385A true CN115686385A (zh) | 2023-02-03 |
CN115686385B CN115686385B (zh) | 2023-03-21 |
Family
ID=85057412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310001206.5A Active CN115686385B (zh) | 2023-01-03 | 2023-01-03 | 一种数据存储方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115686385B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115827508A (zh) * | 2023-01-09 | 2023-03-21 | 苏州浪潮智能科技有限公司 | 一种数据处理方法、系统、设备以及存储介质 |
CN117472967A (zh) * | 2023-12-28 | 2024-01-30 | 江西铜锐信息技术有限公司 | 一种基于数据使用热度的数据生命周期管理方法及系统 |
CN117591039A (zh) * | 2024-01-18 | 2024-02-23 | 济南浪潮数据技术有限公司 | 分布式存储方法、系统、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111158601A (zh) * | 2019-12-30 | 2020-05-15 | 北京浪潮数据技术有限公司 | 一种缓存中的io数据下刷方法、系统及相关装置 |
CN112631521A (zh) * | 2020-12-25 | 2021-04-09 | 苏州浪潮智能科技有限公司 | 一种控制缓存池水位的方法、系统、设备及介质 |
CN113687781A (zh) * | 2021-07-30 | 2021-11-23 | 济南浪潮数据技术有限公司 | 一种热数据的上拉方法、装置、设备及介质 |
CN114675785A (zh) * | 2022-03-29 | 2022-06-28 | 浪潮云信息技术股份公司 | 一种分布式存储方法、装置、系统以及介质 |
-
2023
- 2023-01-03 CN CN202310001206.5A patent/CN115686385B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111158601A (zh) * | 2019-12-30 | 2020-05-15 | 北京浪潮数据技术有限公司 | 一种缓存中的io数据下刷方法、系统及相关装置 |
CN112631521A (zh) * | 2020-12-25 | 2021-04-09 | 苏州浪潮智能科技有限公司 | 一种控制缓存池水位的方法、系统、设备及介质 |
CN113687781A (zh) * | 2021-07-30 | 2021-11-23 | 济南浪潮数据技术有限公司 | 一种热数据的上拉方法、装置、设备及介质 |
CN114675785A (zh) * | 2022-03-29 | 2022-06-28 | 浪潮云信息技术股份公司 | 一种分布式存储方法、装置、系统以及介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115827508A (zh) * | 2023-01-09 | 2023-03-21 | 苏州浪潮智能科技有限公司 | 一种数据处理方法、系统、设备以及存储介质 |
CN117472967A (zh) * | 2023-12-28 | 2024-01-30 | 江西铜锐信息技术有限公司 | 一种基于数据使用热度的数据生命周期管理方法及系统 |
CN117472967B (zh) * | 2023-12-28 | 2024-05-03 | 江西铜锐信息技术有限公司 | 一种基于数据使用热度的数据生命周期管理方法及系统 |
CN117591039A (zh) * | 2024-01-18 | 2024-02-23 | 济南浪潮数据技术有限公司 | 分布式存储方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115686385B (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10579270B2 (en) | Reducing write amplification in solid-state drives by separating allocation of relocate writes from user writes | |
CN115686385B (zh) | 一种数据存储方法、装置、计算机设备及存储介质 | |
US11138124B2 (en) | Migrating data between block pools in a storage system | |
US11023150B2 (en) | Block mode toggling using hybrid controllers | |
US10949108B2 (en) | Enhanced application performance in multi-tier storage environments | |
US11762569B2 (en) | Workload based relief valve activation for hybrid controller architectures | |
CN106547476B (zh) | 用于数据存储系统的方法和装置 | |
US11436159B2 (en) | Using multi-tiered cache to satisfy input/output requests | |
US8572321B2 (en) | Apparatus and method for segmented cache utilization | |
US11086565B2 (en) | Reducing effects of read array operations of read apparent voltage | |
US11797448B2 (en) | Using multi-tiered cache to satisfy input/output requests | |
JP4905810B2 (ja) | ストレージ装置、領域割り当て方法、及びプログラム | |
US11182089B2 (en) | Adapting memory block pool sizes using hybrid controllers | |
CN111399767A (zh) | Io请求的处理方法、系统、设备及计算机可读存储介质 | |
US11151053B2 (en) | Increasing data read and/or write heat tracking resolution in storage devices having cache architecture | |
JP5594647B2 (ja) | ストレージ装置及びその制御方法 | |
Zuolo et al. | Memory driven design methodologies for optimal SSD performance | |
US10503651B2 (en) | Media cache band cleaning | |
US20230281121A1 (en) | Increased garbage collection granularity for non-volatile memory | |
US11816046B2 (en) | Increased read performance for implementations having multiple interface links | |
JP7486534B2 (ja) | ストレージ・システムにおけるブロック・プール・サイズの適合 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |