CN114579061B - 一种数据存储方法、装置、设备及介质 - Google Patents

一种数据存储方法、装置、设备及介质 Download PDF

Info

Publication number
CN114579061B
CN114579061B CN202210462119.5A CN202210462119A CN114579061B CN 114579061 B CN114579061 B CN 114579061B CN 202210462119 A CN202210462119 A CN 202210462119A CN 114579061 B CN114579061 B CN 114579061B
Authority
CN
China
Prior art keywords
data
determining
data block
stored
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210462119.5A
Other languages
English (en)
Other versions
CN114579061A (zh
Inventor
张子奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210462119.5A priority Critical patent/CN114579061B/zh
Publication of CN114579061A publication Critical patent/CN114579061A/zh
Application granted granted Critical
Publication of CN114579061B publication Critical patent/CN114579061B/zh
Priority to PCT/CN2022/138693 priority patent/WO2023207132A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0643Management of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Abstract

本申请公开了一种数据存储方法、装置、设备及介质,涉及分布式存储领域,该方法包括:确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称,所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法,通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。这样一来,本方案不需要利用数据库软件完成数据的存储,而是将数据名称作为键,以数据为值,直接存储至带有键值存储接口的固态硬盘中,进而减少了软件层次,降低系统复杂度与系统开销,高效提升系统性能。

Description

一种数据存储方法、装置、设备及介质
技术领域
本发明涉及分布式存储领域,特别涉及一种数据存储方法、装置、设备及介质。
背景技术
分布式存储系统将数据分散存储在多台独立的设备上,一般采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
在当前主流的分布式存储本地系统中,一般采用磁盘和SSD(即Solid StateDrives,固态硬盘)作为存储介质。数据在存储到介质时,一些记录数据信息的数据,也就是元数据,一般还需要通过键值数据库软件(key-value DB,如RocksDB)组织起来。而当前主流的固态存储介质,普遍使用iSCSI(即Internet Small Computer System Interface,Internet小型计算机系统接口)、NVMe(即Non-Volatile Memory express)接口,但是在存储软件系统中,键值存储由于简单泛用的接口,目前被广泛用于作为存储后端。这就导致了在当前的存储系统中,如果需要使用键值存储系统,就要经过多个软件层的转换,导致软件层次多,系统复杂,这带来了巨大的资源开销。
由上可见,在使用键值存储系统的过程中,如何避免出现由于传统的数据存储方式导致系统复杂度高,系统开销大,软件层次多的情况是本领域有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种数据存储方法、装置、设备及介质,能够减少系统复杂度与软件层次,以及减小系统开销。其具体方案如下:
第一方面,本申请公开了一种数据存储方法,应用于分布式存储系统,包括:
确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法;
通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息;
通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。
可选的,所述利用预设名称确定方法确定所述待存储数据的数据名称之前,还包括:
通过预设切分长度获取接口获取切分长度;
利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块,并确定与所述各数据块对应的切分偏移量;
分别利用所述切分偏移量对所述切分长度进行取余,以获取与所述各数据块对应的取余结果,并将各数据块对应的取余结果确定为各数据块的数据块序号。
可选的,所述利用预设名称确定方法确定所述待存储数据的数据名称,包括:
确定当前存储场景;
利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称;
相应的,所述通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中,包括:
通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;
通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
可选的,所述利用所述数据块序号与所述当前存储场景确定所述待存储数据的数据名称,包括:
若当前存储场景为文件存储或对象存储,则确定与所述待存储数据对应的文件编号,并利用所述文件编号与所述数据块序号确定所述数据块的数据块名称;
若当前存储场景为块存储,则确定与所述待存储数据对应的逻辑单元号,并利用所述逻辑单元号与所述数据块序号确定所述数据块的数据块名称。
可选的,所述利用预设名称确定方法确定所述待存储数据的数据名称,包括:
利用预设哈希算法计算与所述数据块对应的哈希值;
将所述哈希值作为所述数据块的数据块名称;
相应的,所述通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中,包括:
通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;
通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
可选的,所述的数据存储方法,还包括:
将任一数据块所对应的数据块序号与数据块名称进行绑定,并形成映射关系;
将所述数据块序号与数据块名称的映射关系进行记录,以形成数据块序号与数据块名称的映射关系列表。
可选的,所述确定待存储数据之前,还包括:
获取待存储数据,并确定与所述待存储数据对应的目标对象存储设备;
将所述待存储数据写入所述目标对象存储设备中;
相应的,所述确定待存储数据,包括:
从所述目标对象存储设备中提取所述待存储数据。
第二方面,本申请公开了一种数据存储装置,应用于分布式存储系统,包括:
数据名称确定模块,用于确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法;
键值信息构建模块,用于通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息;
信息存储模块,用于通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述的数据存储方法。
第四方面,本申请公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的数据存储方法的步骤。
本申请通过先确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称,所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法,通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。这样一来,本方案避免了传统分布式存储时中使用存储节点的CPU(即Central Processing Unit,中央处理器)、内存等硬件资源,且不需要利用数据库软件完成数据的存储,而是将数据名称作为键,以数据为值,直接存储至带有键值存储接口的固态硬盘中,本方法中存储节点无需进行元数据的管理,进而减少了软件层次,并减少了存储节点的资源消耗,降低了系统复杂度与系统开销,达到高效提升系统性能的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种数据存储方法流程图;
图2为本申请提供的一种数据存储的整体架构图;
图3为一种传统的分布式数据存储的整体架构图;
图4为本申请提供的一种具体的数据存储方法流程图;
图5为本申请提供的一种具体的数据存储方法流程图;
图6为本申请提供的一种数据存储装置结构示意图;
图7为本申请提供的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,当需要使用键值存储系统时,就要在存储节点中使用数据库软件,经过多个软件层的转换完成数据的存储,整个过程中软件层次多,系统复杂,有着巨大的资源开销。在本申请中提出的方法中,不再使用数据库软件等软件方法存储键值信息,而是以数据名称为键,以数据为值,直接使用带有键值存储接口的固态硬盘进行存储,能够减少系统复杂度与软件层次,以及减小系统开销。
本发明实施例公开了一种数据存储方法,应用于分布式存储系统,参见图1所述,该方法包括:
步骤S11:确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法。
本实施例中,所述确定待存储数据之前,还可以包括:获取待存储数据,并确定与所述待存储数据对应的目标对象存储设备;将所述待存储数据写入所述目标对象存储设备中;相应的,所述确定待存储数据,包括:从所述目标对象存储设备中提取所述待存储数据。本实施例中,所述待存储数据为预先写入所述对象存储设备(即Object Storage Device,OSD)中的数据。在一种具体的实施方式中,所述待存储数据可以是从预设的数据池中取出,并存放至对应的目标对象存储设备中的数据。
步骤S12:通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息。
本实施例中,本方法避免了传统分布式存储时中使用存储节点的CPU、内存等硬件资源,并利用数据库软件记录数据的存放位置的方法,而是直接在确定待存储数据的数据名称(即data ID)后,将所述数据名称确定为键(即key),并将所述待存储数据确定为值(即value)的方法,大幅度缩短分布式存储的软件栈,缩短IO(即Input/Output,输入/输出)时延,进而达到提升系统性能的目的。
步骤S13:通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。
可以理解的是,本实施例中所述的固态硬盘为带有键值存储接口的固态硬盘,以下称作KV-SSD。在一种具体的实施方式中,本实施例中所述的固态硬盘也可以是NVMe2.0协议中提出的可直接对外提供键值接口的SSD硬件。
如图2为本申请提出的一种数据存储的整体架构图,图中展示了在与外部进行数据交互后,可以将数据存放至数据池中,并在数据被写入对应的对象存储设备中后,通过存储层将数据写入预设的带有键值存储接口的固态硬盘中的过程,其中可以将数据的数据名称(即data ID)直接作为数据的键(即key),并将数据直接作为值(即value),进而完成键值信息的构建。
如图3为传统的分布式数据存储的整体架构图,通过图2与图3的对比可知,在传统的分布式数据存储中,会利用数据库软件(即图中的RocksDB)对元数据进行处理,而在本申请中,不使用这些数据库软件,而直接使用KV-SSD代替数据库软件存储键值信息,在KV-SSD内部,也就是硬件内部完成元数据系统的管理,有效地减少存储节点的资源消耗与软件层的复杂度。
需要指出的是,本实施例中不再使用传统分布式存储方法中使用数据库软件完成键值信息的存储,只要待存储数据所对应的键与值满足预设的键值存储接口规格,即可适用于本发明中的方法。
本实施例通过先确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称,所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法,通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。这样一来,本方案避免了传统分布式存储时中使用存储节点的CPU、内存等硬件资源,且不需要利用数据库软件完成数据的存储,而是将数据名称作为键,以数据为值,直接存储至带有键值存储接口的固态硬盘中,本方法中存储节点无需进行元数据的管理,而将元数据的管理交由KV-SSD主控CPU完成,进而减少了软件层次,并减少了存储节点的资源消耗,降低了系统复杂度与系统开销,达到高效提升系统性能的目的。
图4为本申请实施例提供的一种具体的数据存储方法流程图。参见图4所示,该方法包括:
步骤S21:确定待存储数据,并通过预设切分长度获取接口获取切分长度。
在一种具体的实施方式中,在确定待存储数据后,可以对所述待存储数据进行切分,并对切分后的数据进行处理。可以理解的是,在这种情况下,则先要通过预设的切分长度获取接口获取切分长度,并在用于后续基于所述切分长度完成数据的切分。在一种具体的实施方式中,所述切分长度可以是2MB或4MB等。
步骤S22:利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块,并确定与所述各数据块对应的切分偏移量。
本步骤中使用通过预设切分长度获取接口获取的切分长度对待存储数据进行切分,并获取切分后的各数据块。可以理解的是,在切分过程中还会确定各数据块的切分偏移量(即offset)。
步骤S23:分别利用所述切分偏移量对所述切分长度进行取余,以获取与所述各数据块对应的取余结果,并将各数据块对应的取余结果确定为各数据块的数据块序号。
本步骤完成的是确定各数据块所对应的数据块序号的过程,数据块序号也可记作data index,其中的具体过程可以是利用切分偏移量对所述切分长度进行取余,即当切分长度为4MB时,数据块序号为data index=offset % 4MB。
步骤S24:确定当前存储场景,并利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称。
本实施例中,所述利用所述数据块序号与所述当前存储场景确定所述待存储数据的数据名称,可以包括:若当前存储场景为文件存储或对象存储,则确定与所述待存储数据对应的文件编号,并利用所述文件编号与所述数据块序号确定所述数据块的数据块名称;若当前存储场景为块存储,则确定与所述待存储数据对应的逻辑单元号,并利用所述逻辑单元号与所述数据块序号确定所述数据块的数据块名称。可以理解的是,本实施例中可以在不同的存储场景下使用不同的数据块名称确定方法,即若当前为文件存储或对象存储时,可以使用文件编号(即inodenumber)和数据块序号确定所述数据块的数据块名称,在一种具体的实施方式中,数据块名称data ID可以记作data ID=inodenumber+offset % 4MB,由于文件编号与所述待存储数据唯一对应,则可以使用此方法得到的data ID区分KV-SSD上的不同文件。若当前为块存储时,可以使用逻辑单元号(即LUN ID)和数据块序号确定所述数据块的数据块名称,在一种具体的实施方式中,数据块名称data ID可以记作data ID=LUN ID + offset % 4MB,由于逻辑单元号与所述待存储数据唯一对应,则可以使用此方法得到的data ID区分KV-SSD上不同卷的数据。
步骤S25:通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息。
其中,关于步骤S25的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S26:通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
其中,关于步骤S26的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
在本实施例中,在获取到待存储数据后,对所述待存储数据进行切分,并获取切分后的各数据块,然后使用基于存储场景的确定方法来确定各数据块的数据块名称,并将数据块名称确定为值,数据块数据确定为值的方式构建键值信息,并存入带有键值存储接口的固态硬盘中,本实施例中所提出的基于存储场景的确定方法计算简单,计算量较小,减少了系统运行开销与系统复杂度。
图5为本申请实施例提供的一种具体的数据存储方法流程图。参见图5所示,该方法包括:
步骤S31:确定待存储数据,并通过预设切分长度获取接口获取切分长度。
其中,关于步骤S31的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S32:利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块。
其中,关于步骤S32的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S33:利用预设哈希算法计算与所述数据块对应的哈希值。
本实施例中可以通过基于哈希算法的确定方法来计算与所述数据块对应的哈希值。所述哈希算法包括但不限于MD5(即Message Digest Algorithm 5,信息摘要算法)、SHA(即Secure Hash Algorithm,安全哈希算法)。
步骤S34:将所述哈希值作为所述数据块的数据块名称。
本实施例中,所述的数据存储方法,还可以包括:将任一数据块所对应的数据块序号与数据块名称进行绑定,并形成映射关系;将所述数据块序号与数据块名称的映射关系进行记录,以形成数据块序号与数据块名称的映射关系列表。需要指出的是,本方法还需额外计算数据块序号data index与数据块名称data ID的对应关系,与上述基于存储场景的确定方法相比,增大了计算量,但本方法的优点是,对于内容相同的数据块,其计算得出的data ID相同,由于相同数据在盘上只储存一份,所以具有重复数据删除的功能。
步骤S35:通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息。
其中,关于步骤S35的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S36:通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
其中,关于步骤S36的其它更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
在本实施例中,在获取到待存储数据后,对所述待存储数据进行切分,并获取切分后的各数据块,然后使用基于哈希算法的确定方法来确定各数据块的数据块名称,并将数据块名称确定为值,数据块数据确定为值的方式构建键值信息,并存入带有键值存储接口的固态硬盘中,本实施例中所提出的基于哈希算法的确定方法与上述基于存储场景的确定方法相比,增大了计算量,但本方法的优点是,对于内容相同的数据块,其计算得出的dataID相同,由于相同数据在盘上只储存一份,所以具有重复数据删除的功能。
参见图6所示,本申请实施例公开了一种数据存储装置,具体可以包括:
数据名称确定模块11,用于确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法;
键值信息构建模块12,用于通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息;
信息存储模块13,用于通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。
本申请通过先确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称,所述预设名称确定方法为基于存储场景的确定方法或基于哈希算法的确定方法,通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中。这样一来,本方案避免了传统分布式存储时中使用存储节点的CPU、内存等硬件资源,且不需要利用数据库软件完成数据的存储,而是将数据名称作为键,以数据为值,直接存储至带有键值存储接口的固态硬盘中,本方法中存储节点无需进行元数据的管理,进而减少了软件层次,并减少了存储节点的资源消耗,降低了系统复杂度与系统开销,达到高效提升系统性能的目的。
在一些具体实施例中,所述数据存储装置,还包括:
切分长度获取模块,用于通过预设切分长度获取接口获取切分长度;
数据切分模块,用于利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块,并确定与所述各数据块对应的切分偏移量;
数据块序号确定模块,用于分别利用所述切分偏移量对所述切分长度进行取余,以获取与所述各数据块对应的取余结果,并将各数据块对应的取余结果确定为各数据块的数据块序号。
在一些具体实施例中,所述数据名称确定模块11,包括:
场景确定单元,用于确定当前存储场景;
第一数据块名称确定单元,用于利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称;
相应的,所述键值信息构建模块12与信息存储模块13,包括:
第一键值信息构建单元,用于通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;
第一信息存储单元,用于通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
在一些具体实施例中,所述第一数据块名称确定单元,包括:
第一场景命名单元,用于若当前存储场景为文件存储或对象存储,则确定与所述待存储数据对应的文件编号,并利用所述文件编号与所述数据块序号确定所述数据块的数据块名称;
第二场景命名单元,用于若当前存储场景为块存储,则确定与所述待存储数据对应的逻辑单元号,并利用所述逻辑单元号与所述数据块序号确定所述数据块的数据块名称。
在一些具体实施例中,所述数据名称确定模块11,包括:
哈希值确定单元,用于利用预设哈希算法计算与所述数据块对应的哈希值;
第二数据块名称确定单元,用于将所述哈希值作为所述数据块的数据块名称;
相应的,所述键值信息构建模块12与信息存储模块13,包括:
第一键值信息构建单元,用于通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;
第一信息存储单元,用于通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中。
在一些具体实施例中,所述数据存储装置,还包括:
映射关系确定单元,用于将任一数据块所对应的数据块序号与数据块名称进行绑定,并形成映射关系;
映射列表确定单元,用于将所述数据块序号与数据块名称的映射关系进行记录,以形成数据块序号与数据块名称的映射关系列表。
在一些具体实施例中,所述数据存储装置,还包括:
对象存储设备确定单元,用于获取待存储数据,并确定与所述待存储数据对应的目标对象存储设备;
数据写入单元,用于将所述待存储数据写入所述目标对象存储设备中;
相应的,所述数据名称确定模块11中,包括:
数据提取单元,用于从所述目标对象存储设备中提取所述待存储数据。
进一步的,本申请实施例还公开了一种电子设备,图7是根据示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图7为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、显示屏24、输入输出接口25、通信接口26和通信总线27。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的数据存储方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口26能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的数据存储方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,这里所说的计算机可读存储介质包括随机存取存储器(Random Access Memory,RAM)、内存、只读存储器(Read-OnlyMemory,ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、磁碟或者光盘或技术领域内所公知的任意其他形式的存储介质。其中,所述计算机程序被处理器执行时实现前述公开的数据存储方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的数据存储方法、装置、设备、存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种数据存储方法,其特征在于,应用于分布式存储系统,包括:
确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法;
通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息;
通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中;
其中,所述利用预设名称确定方法确定所述待存储数据的数据名称之前,还包括:通过预设切分长度获取接口获取切分长度;利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块,并确定与所述各数据块对应的切分偏移量;分别利用所述切分偏移量对所述切分长度进行取余,以获取与所述各数据块对应的取余结果,并将各数据块对应的取余结果确定为各数据块的数据块序号;
并且,所述利用预设名称确定方法确定所述待存储数据的数据名称,包括:确定当前存储场景;利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称;相应的,所述通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息,通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中,包括:通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中;
并且,所述利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称,包括:若当前存储场景为文件存储或对象存储,则确定与所述待存储数据对应的文件编号,并利用所述文件编号与所述数据块序号确定所述数据块的数据块名称;若当前存储场景为块存储,则确定与所述待存储数据对应的逻辑单元号,并利用所述逻辑单元号与所述数据块序号确定所述数据块的数据块名称。
2.根据权利要求1所述的数据存储方法,其特征在于,还包括:
将任一数据块所对应的数据块序号与数据块名称进行绑定,并形成映射关系;
将所述数据块序号与数据块名称的映射关系进行记录,以形成数据块序号与数据块名称的映射关系列表。
3.根据权利要求1至2任一项所述的数据存储方法,其特征在于,所述确定待存储数据之前,还包括:
获取待存储数据,并确定与所述待存储数据对应的目标对象存储设备;
将所述待存储数据写入所述目标对象存储设备中;
相应的,所述确定待存储数据,包括:
从所述目标对象存储设备中提取所述待存储数据。
4.一种数据存储装置,其特征在于,应用于分布式存储系统,包括:
数据名称确定模块,用于确定待存储数据,并利用预设名称确定方法确定所述待存储数据的数据名称;所述预设名称确定方法为基于存储场景的确定方法;
键值信息构建模块,用于通过将所述数据名称确定为键以及将所述待存储数据确定为值的方式,构建所述待存储数据对应的键值信息;
信息存储模块,用于通过固态硬盘中的键值存储接口将所述待存储数据对应的所述键值信息存储至所述固态硬盘中;
其中,所述数据存储装置,还用于在利用预设名称确定方法确定所述待存储数据的数据名称之前,通过预设切分长度获取接口获取切分长度;利用所述切分长度对所述待存储数据进行切分,以获取与所述待存储数据所对应的各数据块,并确定与所述各数据块对应的切分偏移量;分别利用所述切分偏移量对所述切分长度进行取余,以获取与所述各数据块对应的取余结果,并将各数据块对应的取余结果确定为各数据块的数据块序号;
并且,所述数据名称确定模块,用于确定当前存储场景;利用所述数据块序号与所述当前存储场景确定所述各数据块的数据块名称;相应的,所述键值信息构建模块,用于通过将所述数据块名称确定为键以及将所述数据块中的数据块数据确定为值的方式,构建所述数据块对应的键值信息;所述信息存储模块用于通过固态硬盘中的键值存储接口将所述数据块对应的所述键值信息存储至所述固态硬盘中;
并且,所述数据名称确定模块,具体用于若当前存储场景为文件存储或对象存储,则确定与所述待存储数据对应的文件编号,并利用所述文件编号与所述数据块序号确定所述数据块的数据块名称;若当前存储场景为块存储,则确定与所述待存储数据对应的逻辑单元号,并利用所述逻辑单元号与所述数据块序号确定所述数据块的数据块名称。
5.一种电子设备,其特征在于,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至3任一项所述的数据存储方法。
6.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的数据存储方法。
CN202210462119.5A 2022-04-28 2022-04-28 一种数据存储方法、装置、设备及介质 Active CN114579061B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210462119.5A CN114579061B (zh) 2022-04-28 2022-04-28 一种数据存储方法、装置、设备及介质
PCT/CN2022/138693 WO2023207132A1 (zh) 2022-04-28 2022-12-13 一种数据存储方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210462119.5A CN114579061B (zh) 2022-04-28 2022-04-28 一种数据存储方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114579061A CN114579061A (zh) 2022-06-03
CN114579061B true CN114579061B (zh) 2022-07-29

Family

ID=81778039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210462119.5A Active CN114579061B (zh) 2022-04-28 2022-04-28 一种数据存储方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN114579061B (zh)
WO (1) WO2023207132A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579061B (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种数据存储方法、装置、设备及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130173853A1 (en) * 2011-09-26 2013-07-04 Nec Laboratories America, Inc. Memory-efficient caching methods and systems
CN102722449B (zh) * 2012-05-24 2015-01-21 中国科学院计算技术研究所 基于SSD的Key-Value型本地存储方法及系统
US9934264B2 (en) * 2015-06-02 2018-04-03 Netapp, Inc. Technique for reducing metadata stored in a memory of a node
CN105912687B (zh) * 2016-04-19 2019-05-24 江苏物联网研究发展中心 海量分布式数据库存储单元
US11644992B2 (en) * 2016-11-23 2023-05-09 Samsung Electronics Co., Ltd. Storage system performing data deduplication, method of operating storage system, and method of operating data processing system
US10769064B1 (en) * 2017-12-20 2020-09-08 Pliops Ltd Method for retrieving key value pairs and groups of key value pairs
CN111831208B (zh) * 2019-04-16 2023-04-14 中移(苏州)软件技术有限公司 一种信息处理方法、装置、终端设备及存储介质
KR20210004701A (ko) * 2019-07-05 2021-01-13 삼성전자주식회사 키-밸류 기반으로 데이터를 저장하는 스토리지 장치 및 이의 동작 방법
CN111538461B (zh) * 2020-04-21 2023-04-07 招商局金融科技有限公司 基于固态硬盘缓存的数据读写方法、装置及存储介质
CN112214468B (zh) * 2020-10-18 2023-01-06 苏州浪潮智能科技有限公司 一种分布式存储系统小文件加速方法、装置、设备及介质
CN112434015B (zh) * 2020-12-08 2022-08-19 新华三大数据技术有限公司 数据存储的方法、装置、电子设备及介质
CN113051221B (zh) * 2021-03-31 2023-06-30 网易(杭州)网络有限公司 数据存储方法、装置、介质、设备及分布式文件系统
CN113609090A (zh) * 2021-08-06 2021-11-05 杭州网易云音乐科技有限公司 数据存储方法及装置、计算机可读存储介质、电子设备
CN113608699A (zh) * 2021-08-09 2021-11-05 北京金山云网络技术有限公司 数据写入方法、装置及电子设备
CN113806300B (zh) * 2021-09-23 2023-08-01 北京百度网讯科技有限公司 数据存储方法、系统、装置、设备及存储介质
CN114356921A (zh) * 2021-12-28 2022-04-15 中国农业银行股份有限公司 数据处理方法、装置、服务器及存储介质
CN114579061B (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种数据存储方法、装置、设备及介质

Also Published As

Publication number Publication date
WO2023207132A1 (zh) 2023-11-02
CN114579061A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
US10210191B2 (en) Accelerated access to objects in an object store implemented utilizing a file storage system
US11296940B2 (en) Centralized configuration data in a distributed file system
US11693789B2 (en) System and method for mapping objects to regions
CN110019004B (zh) 一种数据处理方法、装置及系统
US20160217167A1 (en) Hash Database Configuration Method and Apparatus
US11221921B2 (en) Method, electronic device and computer readable storage medium for data backup and recovery
CN111177143B (zh) 键值数据存储方法、装置、存储介质与电子设备
US10831371B2 (en) Quota controlled movement of data in a tiered storage system
CN109446177B (zh) 一种分布式文件系统目录文件个数配额的实现方法及装置
CN113806300B (zh) 数据存储方法、系统、装置、设备及存储介质
CN110147203B (zh) 一种文件管理方法、装置、电子设备及存储介质
CN114579061B (zh) 一种数据存储方法、装置、设备及介质
US11157456B2 (en) Replication of data in a distributed file system using an arbiter
CN115114232A (zh) 一种历史版本对象列举方法、装置及其介质
CN112000971B (zh) 一种文件权限记录方法、系统及相关装置
CN111435286A (zh) 一种数据存储方法、装置和系统
US11943294B1 (en) Storage medium and compression for object stores
US10762139B1 (en) Method and system for managing a document search index
CN111966845A (zh) 图片管理方法、装置、存储节点及存储介质
CN111782588A (zh) 一种文件读取方法、装置、设备和介质
CN115904263B (zh) 一种数据迁移方法、系统、设备及计算机可读存储介质
CN111881085B (zh) 一种读写带宽性能的优化方法及系统
US20230342293A1 (en) Method and system for in-memory metadata reduction in cloud storage system
CN114676139A (zh) 一种索引数据存储方法、系统、设备及存储介质
CN115328859A (zh) 一种元数据访问方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant