CN114138194B

CN114138194B - 一种数据分布存储方法、装置、设备及介质

Info

Publication number: CN114138194B
Application number: CN202111415603.4A
Authority: CN
Inventors: 鄢婷; 李楠
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2021-11-25
Filing date: 2021-11-25
Publication date: 2023-06-09
Anticipated expiration: 2041-11-25
Also published as: CN114138194A

Abstract

本申请公开了一种数据分布存储方法、装置、设备及介质，包括：确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；利用当前权重调整规则调整当前节点权重以得到当前更新后的集群，并基于CRUSH算法确定目标对象存储节点；将一个归置组模拟存储至当前目标节点后确定各节点的归置组数量的第二标准差；基于第一标准差和第二标准差确定出用于评价当前权重调整规则的强化学习函数数值；当第一标准差小于第二标准差，则根据强化学习函数数值对当前权重调整规则进行优化并更新，重新执行前述步骤，直到第一标准差不小于第二标准差，然后输出当前各对象存储节点的权重值进行数据均衡处理。可以提高磁盘利用率和负载均衡性能。

Description

一种数据分布存储方法、装置、设备及介质

技术领域

本发明涉及计算机技术领域，特别涉及一种数据分布存储方法、装置、设备及介质。

背景技术

在分布式存储系统中，数据一致性、可靠性和负载均衡是最重要的特性。其中，数据分布问题直接影响集群的负载均衡，优秀的数据分布算法对一个分布式存储系统尤为重要。在分布式存储系统中，数据存储包括两个映射：对象到PG(Placement Group，归置组)的映射，PG到OSD(Object-based Storage Device，基于对象的存储设备)的映射。其中，对象到PG的映射是通过文件切片，将文件按照部署结构切分成固定大小的对象实现；PG到OSD的映射是通过CRUSH(Controlled Replication Under Scalable Hashing)算法实现，根据集群部署结构，使用HASH(哈希)算法产生伪随机数对节点进行加权运算，采用层级结构迭代的方法将每个PG映射到一组最适合的OSD节点中。

然而，在实际应用中，如果存储的单个数据对象太小,影响节点权重的变化较小,容易造成一组相关性高的PG存入相同的存储节点中，此时进行数据访问时就会造成某些节点使用率过高的情况，进而影响集群性能；另一方面，如果对集群的存储规模进行改动，如扩容、缩容、节点或网络故障，此时集群节点的权重值差异也会导致小文件数据对象PG落入相同的存储节点,造成存储数据分布不均衡,进而影响集群的性能。

发明内容

有鉴于此，本发明的目的在于提供一种数据分布存储方法、装置、设备及介质，能够提高磁盘利用率和负载均衡性能。其具体方案如下：

第一方面，本申请公开了一种数据分布存储方法，包括：

确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；

利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；

将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；

基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；

当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

可选的，所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，包括：

利用当前权重调整规则，从当前所述分布式存储集群中确定出待调整对象存储节点，并对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群。

可选的，所述从当前所述分布式存储集群中确定出待调整对象存储节点，包括：

基于CRUSH算法从当前所述分布式存储集群中确定当前的第一对象存储节点；

基于预设节点筛选规则从所有未曾被确定为所述第一对象存储节点的对象存储节点中筛选出第二对象存储节点；

将当前的所述第一对象存储节点和/或所述第二对象存储节点确定为待调整对象存储节点。

可选的，所述基于预设节点筛选规则从所有未曾被确定为所述第一对象存储节点的对象存储节点中筛选出第二对象存储节点，包括：

从所有未曾被确定为所述第一对象存储节点的对象存储节点中，筛选出与当前的所述第一对象存储节点之间的相对位置信息满足预设条件的对象存储节点作为第二对象存储节点。

可选的，所述对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，包括：

确定所述第二标准差与所述第一标准差之间的差值的绝对值；

确定与所述绝对值对应的权重调整范围，并根据所述权重调整范围对所述待调整对象存储节点进行相应的权重调整以得到当前更新后的所述分布式存储集群。

可选的，所述基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值，包括：

基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的Q学习函数数值。

确定所述第二标准差与所述第一标准差之间的差值；

基于所述差值构造强化学习函数中的回报值，并将所述回报值输入至所述强化学习函数，以得到所述强化学习函数输出的用于评价所述当前权重调整规则的强化学习函数数值。

第二方面，本申请公开了一种数据分布存储装置，包括：

第一标准差确定模块，用于确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；

节点确定模块，用于利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；

第二标准差确定模块，用于将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；

数值确定模块，用于基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；

权重调整模块，用于当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

第三方面，本申请公开了一种电子设备，包括处理器和存储器；其中，所述处理器执行所述存储器中保存的计算机程序时实现前述的数据分布存储方法。

第四方面，本申请公开了一种计算机可读存储介质，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现前述的数据分布存储方法。

本申请中，先确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。可见，通过引入强化学习算法，利用当前分布式存储集群中各对象存储节点的归置组数量的第一标准差和模拟存储后的集群中各对象存储节点的归置组数量的第二标准差对权重调整规则进行优化，避免了归置组按照常规计算方法存储至相同的对象存储节点，使得归置组在各对象存储节点上均匀分布，并利用当前各对象存储节点的权重值对所述分布式存储集群进行数据均衡处理，提高了分布式集群的负载均衡性能，同时对象存储节点的磁盘利用率也得以提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种数据分布存储方法流程图；

图2为本申请公开的一种具体的数据分布存储方法流程图；

图3为本申请公开的一种具体的数据分布存储方法流程图；

图4为本申请公开的一种数据分布存储装置结构示意图；

图5为本申请公开的一种电子设备结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

当前，在分布式存储系统中，数据一致性、可靠性和负载均衡是最重要的特性。然而，在实际应用中，存在存储数据分布不均衡,进而影响集群的性能的问题。

为此，本申请提供了一种数据分布存储方案，能够提高磁盘利用率和负载均衡性能。

本申请实施例公开了一种数据分布存储方法，参见图1所示，该方法包括：

步骤S11：确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差。

本申请实施例可以普遍地应用于ceph(分布式文件系统)中，当客户端访问ceph分布式存储时，会收到命令行设置的数据对象大小、集群规模和部署模式等具体策略模型设置的相关参数，该策略模型直接对接ceph底层接口，在收到相关参数后，对参数进行保存。

需要指出的是，本申请实施例主要针对CRUSH算法存在归置组映射到对象存储节点分布不均匀的问题做了优化。在CRUSH算法中，将归置组存储到一个对象存储节点上的过程主要取决于对象存储节点的权重值，利用哈希算法生成的伪随机数乘以各对象存储节点对应的权重，筛选出乘积最大值对应的对象存储节点，那么归置组则会存储到该对象存储节点。

本申请实施例中，由于CRUSH算法会导致归置组一直存储至权重最大的对象存储节点上，导致分布式存储集群负载不均衡，当检测到当前分布式存储集群中存在负载不均衡的情况时，则说明需要对当前的分布式存储集群中的各对象存储节点的归置组数量进行调整。所以可以将当前分布式存储集群中归置组在对象存储节点上分布不均衡的问题转化为求较小标准差的问题，此时，需要确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差。

在一种具体实施方式中，可以先定义变量集合，定义分布式存储集群中存在m个对象存储节点集合为osd_number＝(osd₀，...,osd_m-1)，n个PG集合为pg_number＝(pg₀，...,pg_n-1)，pg_n-1表示第n个归置组PG，m个OSD的权重集合为weight＝(w₀,...,w_m-1)，w_m-1表示第m个OSD的权重，当前每个分布式存储集群中各对象存储节点的归置组数量集合为crush_pg_number＝(t₀,...,t_m-1)，t_m-1表示第m个对象存储节点的归置组数量。

本实施例中，在计算某个归置组PG_i的OSD映射位置时，设当前每个对象存储节点中的归置组数量为crush_pg_number_i＝(t₀ ⁱ,...,t_m-1 ⁱ)，相应的，归置组总数为

当前每个存储对象节点上的归置组数量的平均值为/>

所以当前分布式存储集群中各对象存储节点的归置组数量的第一标准差为：/>

步骤S12：利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点。

需要指出的是，本申请是用来解决归置组数量在分布式存储集群中的各对象存储节点上分布不均衡的问题，也就是说，若当前分布式存储集群中各对象存储节点的归置组数量出现负载不均衡，则利用本申请对所述分布式存储集群进行数据均衡处理。

可以理解的是，归置组存储位置的选择与各对象存储节点所对应的伪随机数和各对象存储节点的权重有关，该对象存储节点的权重是指该节点的可存储剩余容量，因此随着归置组不断被存储至对象存储节点中，其节点所对应的权重是不断变化的。此外，由于CRUSH算法是将归置组存储至权重与伪随机数乘积最大的对象存储节点，因此在当前分布式存储集群中各对象存储节点的归置组数量出现负载不均衡时就需要调整当前所述分布式存储集群的对象存储节点的权重。本实施例利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，然后基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点。

本申请实施例中，基于CRUSH算法从进行权重调整后的当前所述分布式存储集群中确定目标对象存储节点的过程如下所述，首先确定好一个归置组，利用哈希算法为所述归置组生成伪随机数，然后确定所述更新后的所述分布式存储集群中的各对象存储节点对应的权重，计算所述伪随机数与所述各对象存储节点对应的权重的乘积，并从所述乘积中筛选出最大乘积，将所述最大乘积对应的对象存储节点确定为目标对象存储节点。

步骤S13：将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差。

在本申请实施例中，如果想要实现当前分布式存储系统的负载均衡，需要模拟将一个归置组存储至当前所述目标对象存储节点中，通过确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差，可以知道模拟将一个归置组存储至当前所述目标对象存储节点后归置组在当前分布式存储集群的分布均衡情况。

在一种具体实施方式中，可以定义模拟将一个归置组存储至当前目标对象存储节点后各个对象存储节点上的归置组数量为：

Q_CRUSH_PG_i+1_number＝(l₀ ⁱ⁺¹,...,l_m-1 ⁱ⁺¹)；

可以理解的是，归置组总数为

其中，模拟将一个归置组存储至当前目标对象存储节点后各个对象存储节点后的归置组数量的平均值为/>

所以当前分布式存储集群中各对象存储节点的归置组数量的第二标准差为/>

步骤S14：基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值。

需要指出的是，强化学习函数数值是用来表征对当下选择某种行为动作得到的回馈。具体到本实施例中，则用来表征利用权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整后所得回馈。

此外，由于第一标准差是进行权重调整之前由当前分布式存储集群中各对象存储节点的归置组数量计算得到的；第二标准差是在将一个归置组模拟存储至目标对象存储节点后，由当前各对象存储节点归置组数量计算得到的，并且目标对象存储节点是在利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整后基于CRUSH算法所确定的，因此可以基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值。

步骤S15：当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，重复步骤S12。

可以理解的是，标准差越小，所述分布式存储集群中的均衡性越好。然而在当前分布式存储集群负载不均衡的情况下，如果所述第一标准差小于所述第二标准差，说明在进行强化学习之后得到了负反馈，即模拟将一个归置组存储至当前所述的目标对象存储节点后，当前的分布式存储集群反而更加不均衡，此时则需要根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，重新跳转至步骤S12，直到所述第一标准差大于或等于所述第二标准差。

步骤S16：当所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

本申请实施例中，当所述第一标准差大于或等于所述第二标准差，说明在进行强化学习之后得到了正反馈，即模拟将一个归置组存储至当前所述的目标对象存储节点后，当前的分布式存储集群可以实现负载均衡，此时可以输出当前各所述对象存储节点的权重值，并利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

可见，本申请中，先确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。可见，通过引入强化学习算法，利用当前分布式存储集群中各对象存储节点的归置组数量的第一标准差和模拟存储后的集群中各对象存储节点的归置组数量的第二标准差对权重调整规则进行优化，避免了归置组按照常规计算方法存储至相同的对象存储节点，使得归置组在各对象存储节点上均匀分布，并利用当前各对象存储节点的权重值对所述分布式存储集群进行数据均衡处理，提高了分布式集群的负载均衡性能，同时对象存储节点的磁盘利用率也得以提升。

参见图2所示，本申请实施例公开了一种具体的数据分布存储方法，该方法包括：

步骤S21：确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差。

步骤S22：利用当前权重调整规则，从当前所述分布式存储集群中确定出待调整对象存储节点，并对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点。

本申请实施例中，当分布式存储集群中出现负载不均衡的情况时，为了使得归置组在存储节点上均匀分布，需要对分布式存储集群中的对象存储节点进行权重调整，这样可以使归置组不再全部存储到当前权重最大的对象存储节点中，从而实现负载均衡。

具体的，利用当前权重调整规则，从当前所述分布式存储集群中确定出待调整对象存储节点，并对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群。可以理解的是，当前权重调整规则是用来确定出当前分布式存储集群中的需要调整权重的对象存储节点的，基于CRUSH算法从当前所述分布式存储集群中确定当前的第一对象存储节点。因为CRUSH算法选择的是权重最大的对象存储节点并将归置组存储至该节点，所以为了使当前分布式存储集群实现负载均衡，归置组将不再存储至该节点，此时，在利用当前权重调整规则时，需要基于预设节点筛选规则从所有未曾被确定为所述第一对象存储节点的对象存储节点中筛选出第二对象存储节点，并将当前的所述第一对象存储节点和/或所述第二对象存储节点确定为待调整对象存储节点。

本实施例中，在确定出所述待调整对象存储节点后，要对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，具体做法为：确定所述第二标准差与所述第一标准差之间的差值的绝对值；确定与所述绝对值对应的权重调整范围，并根据所述权重调整范围对所述待调整对象存储节点进行相应的权重调整以得到当前更新后的所述分布式存储集群。

步骤S23：将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差。

步骤S24：基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的Q学习函数数值。

本申请实施例中，利用强化学习对算法进行优化，通过让一个智能体Agent与环境交互来训练模型，当智能体Agent的行为产生期望的结果时，它得到正反馈。具体的，可以利用Q学习来对算法进行优化，在此不做具体限定。

可以理解的是，Q学习算法中的Q值函数是状态和行为的评价值，表示从长期角度来看行为动作的好坏，定义为Q(s_t,a_t)＝R(s_t,a_t)+gmax{Q(s_t+1,a_t+1)}。其中，s_t和a_t是t时刻的状态和行为，g是衰减因子(0<g<1)，用于调节智能体Agent对未来累计回报的关注程度，当选定一组行为动作并执行后，系统进入下一个状态s_t+1，同时，智能体Agent也得到相应的回报函数R(s_t,a_t)，然后对Q值函数进行迭代更新：Q_t+1(s_t,a_t)＝(1-g)Q(s_t,a_t)+g[R(s_t,a_t)+gmax{Q(s_t+1,a_t+1)}]；根据Q值函数来选取能够获得最大收益的行为动作。

进一步的，在进行强化学习的过程中，需要设计回报函数，具体可以包括：确定所述第二标准差与所述第一标准差之间的差值；基于所述差值构造强化学习函数中的回报值，并将所述回报值输入至所述强化学习函数，以得到所述强化学习函数输出的用于评价所述当前权重调整规则的强化学习函数数值，即回报函数设置为Q_CRUSH_S减去CRUSH_S。也就是说，基于CRUSH算法进行Q学习和CRUSH算法选择出的对象存储节点的归置组数量标准差的对比，该值直接反应了归置组在各对象存储节点上分布的均衡性。

步骤S25：当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，重复步骤S22。

步骤S26：当所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

其中，关于上述步骤S21、步骤S23、步骤S25和步骤S26更加具体的处理过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

可见，本申请中，先确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；利用当前权重调整规则，从当前所述分布式存储集群中确定出待调整对象存储节点，并对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的Q学习函数数值；当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。如此一来，将Q学习函数数值确定为强化学习函数数值，利用当前分布式存储集群中各对象存储节点的归置组数量的第一标准差和模拟存储后的集群中各对象存储节点的归置组数量的第二标准差对权重调整规则进行优化，避免了归置组按照常规计算方法存储至相同的对象存储节点，使得归置组在各对象存储节点上均匀分布，并利用当前各对象存储节点的权重值对所述分布式存储集群进行数据均衡处理，提高了分布式集群的负载均衡性能，同时对象存储节点的磁盘利用率也得以提升。

如图3所示，公开了一种具体的数据分布存储方法流程图，对前述步骤进行说明。具体的，当客户端收到命令行输入的设置参数时，对参数进行保存。首先调用Agent函数，选择一组动作A₁,A₂。在选择动作前先进行状态设计S，即计算第i个归置组存储的对象存储节点位置，定义各对象存储节点的权重为PG_i_Weight＝{w₀ ⁱ,...,w_m-1 ⁱ},该权重集合确定了归置组将存储到哪个对象存储节点上，设计状态空间S为PG_i_Weight。然后进行行为设计A，用于调整各个对象存储节点的权重值，A₁＝{L,R}，A₂＝{L_up，L_down，R_up，R_down}，L和R表示状态s移动的方向，分别为向左和向右移动，L_up，L_down，R_up，R_down表示状态s向左或右移动后，按照步长调整选中的对象存储节点的权重值。其次，触发环境更新，执行CRUSH算法获得哈希伪随机数，伪随机数乘以权重选择目标对象存储节点，得出CRUSH_S。然后计算Q_CRUSH_S，更新回报函数R(s，a)，更新Q值函数Q(s，a)。最后判断Q_CRUSH_S是否小于等于CRUSH_S，为否则进入下一状态，继续学习，为是则返回对象存储节点。持续进行Q学习训练，直至基于CRUSH算法Q学习算法收敛，保存最佳的权重值，并根据最佳权重值，得到对象存储节点上归置组的均衡分布。

相应的，本申请实施例还公开了一种数据分布存储装置，参见图4所示，该装置包括：

第一标准差确定模块11，用于确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；

节点确定模块12，用于利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；

第二标准差确定模块13，用于将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；

数值确定模块14，用于基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；

权重调整模块15，用于当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。

可见，本申请实施例中，先确定当前分布式存储集群中各对象存储节点的归置组数量的第一标准差；利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，并基于CRUSH算法从当前所述分布式存储集群中确定目标对象存储节点；将一个归置组模拟存储至当前所述目标对象存储节点，并确定经过所述模拟存储后的集群中各对象存储节点的归置组数量的第二标准差；基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值；当所述第一标准差小于所述第二标准差，则根据所述强化学习函数数值对所述当前权重调整规则进行优化以更新所述当前权重调整规则，并重新跳转至所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群的步骤，直到所述第一标准差大于或等于所述第二标准差，然后输出当前各所述对象存储节点的权重值，以利用当前各所述对象存储节点的权重值对所述分布式存储集群进行数据均衡处理。可见，通过引入强化学习算法，利用当前分布式存储集群中各对象存储节点的归置组数量的第一标准差和模拟存储后的集群中各对象存储节点的归置组数量的第二标准差对权重调整规则进行优化，避免了归置组按照常规计算方法存储至相同的对象存储节点，使得归置组在各对象存储节点上均匀分布，并利用当前各对象存储节点的权重值对所述分布式存储集群进行数据均衡处理，提高了分布式集群的负载均衡性能，同时对象存储节点的磁盘利用率也得以提升。

进一步的，本申请实施例还公开了一种电子设备，图5是根据一示例性实施例示出的电子设备20结构图，图中内容不能认为是对本申请的使用范围的任何限制。

图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20，具体可以包括：至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中，所述存储器22用于存储计算机程序，所述计算机程序由所述处理器21加载并执行，以实现前述任一实施例公开的数据分布存储方法中的相关步骤。

本实施例中，电源23用于为电子设备20上的各硬件设备提供工作电压；通信接口24能够为电子设备20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议，在此不对其进行具体限定；输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。

另外，存储器22作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源可以包括操作系统221、计算机程序222及数据223等，数据223可以包括各种各样的数据。存储方式可以是短暂存储或者永久存储。

其中，操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222，其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的数据分布存储方法的计算机程序之外，还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的，本申请还公开了一种计算机可读存储介质，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现前述公开的数据分布存储方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种数据分布存储方法、装置、设备及介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据分布存储方法，其特征在于，包括：

2.根据权利要求1所述的数据分布存储方法，其特征在于，所述利用当前权重调整规则对当前所述分布式存储集群的对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，包括：

3.根据权利要求2所述的数据分布存储方法，其特征在于，所述从当前所述分布式存储集群中确定出待调整对象存储节点，包括：

4.根据权利要求3所述的数据分布存储方法，其特征在于，所述基于预设节点筛选规则从所有未曾被确定为所述第一对象存储节点的对象存储节点中筛选出第二对象存储节点，包括：

5.根据权利要求2所述的数据分布存储方法，其特征在于，所述对所述待调整对象存储节点进行权重调整以得到当前更新后的所述分布式存储集群，包括：

6.根据权利要求1所述的数据分布存储方法，其特征在于，所述基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值，包括：

7.根据权利要求1至6任一项所述的数据分布存储方法，其特征在于，所述基于所述第一标准差和所述第二标准差确定出用于评价所述当前权重调整规则的强化学习函数数值，包括：

确定所述第二标准差与所述第一标准差之间的差值；

8.一种数据分布存储装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器和存储器；其中，所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至7任一项所述的数据分布存储方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据分布存储方法。