CN109947375B - 一种基于分区处理共识算法的分布式存储系统优化方法 - Google Patents

一种基于分区处理共识算法的分布式存储系统优化方法 Download PDF

Info

Publication number
CN109947375B
CN109947375B CN201910269201.4A CN201910269201A CN109947375B CN 109947375 B CN109947375 B CN 109947375B CN 201910269201 A CN201910269201 A CN 201910269201A CN 109947375 B CN109947375 B CN 109947375B
Authority
CN
China
Prior art keywords
processing
storage system
distributed storage
copy
partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910269201.4A
Other languages
English (en)
Other versions
CN109947375A (zh
Inventor
葛洪伟
赵守月
杨金龙
江明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kaimeng Technology Co.,Ltd.
Wuxi Xiangyuan Information Technology Co ltd
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201910269201.4A priority Critical patent/CN109947375B/zh
Publication of CN109947375A publication Critical patent/CN109947375A/zh
Application granted granted Critical
Publication of CN109947375B publication Critical patent/CN109947375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于分区处理共识算法的分布式存储系统优化方法,属于分布式系统性能优化领域,主要解决现有分布式存储系统性能随客户端命令冲突的增多而下降的问题。该优化方法实时监控客户端命令的处理情况,并根据客户端命令处理情况,判断是否需要进行分区处理。对无需分区处理的情况,分布式存储系统中各副本采用EPaxos共识算法处理客户端命令;对需要分区处理的情况,先生成分区方案,再根据具体的分区方案协调分布式存储系统中各副本的处理流程,进行分区处理。本发明在客户端命令冲突影响分布式存储系统性能的情况下,能提升系统的延迟与吞吐量性能,同时可以更好地适应不同的客户端环境,满足实际应用的需求。

Description

一种基于分区处理共识算法的分布式存储系统优化方法
技术领域
本发明属于分布式系统性能优化领域,涉及分布式存储系统性能优化方法,具体地说是一种基于分区处理共识算法的分布式存储系统优化方法,可用于分布式系统的性能优化。
背景技术
网络飞速发展,应用程序规模呈现逐步扩大的趋势,数据量持续增长……人们逐渐意识到分布式系统在工程实践中不可或缺的作用。分布式存储系统作为分布式系统中的一种,是大型应用程序的基础。谷歌、亚马逊、雅虎、阿里巴巴等公司均有自己的分布式存储系统。
不同于传统存储系统集中存储数据的方式,分布式存储系统将数据分散在不同的物理设备(副本)上存储,不仅有助于分散存储负荷,也便于提供高可用与高性能的服务,但需要对分散在多个副本上的数据进行同步与协调,以确保整个存储系统数据的一致性。共识算法便是用来同步与协调副本数据,确保系统数据一致性的算法。实际应用中,分布式存储系统收到客户端发送的读写请求后,采用共识算法处理,以确保客户端写请求在多个相关副本中同步写入,客户端读请求能返回一致的结果。
提升共识算法的性能,使分布式存储系统以最小的延迟和最大的吞吐量处理收到的客户端命令,对分布式存储系统性能优化以及分布式存储系统的发展具有重要意义。目前,大多数分布式存储系统中的共识算法以Multi-Paxos算法及其变种为基础实现。Multi-Paxos算法变种中,EPaxos算法以集群内高吞吐量和广域网环境下低延迟为设计目标,采取所有副本均可处理客户端读写请求的策略,相较其他Multi-Paxos算法变种,在系统延迟与吞吐量性能方面,表现优异,但随着客户端命令冲突的增多,系统延迟与吞吐量性能也会下降。对客户端命令冲突情况影响系统延迟与吞吐量性能的问题进行优化,使其作为分布式存储系统共识算法时表现出更优异的系统性能,对提升分布式存储系统性能,促进分布式存储系统的发展具有重要意义。
发明内容
本发明方法针对上述问题,以优化分布式存储系统性能为目标,提出一种基于分区处理共识算法的分布式存储系统优化方法,以解决分布式存储系统性能随客户端命令冲突的增多而下降的问题,能够在客户端命令冲突影响分布式存储系统性能的情况下,提升系统的延迟与吞吐量性能,同时可以更好地适应不同的客户端环境,满足实际应用的需求。
实现本发明的关键技术是:在EPaxos共识算法的基础上,引入分区处理的思想,实时监控客户端命令的处理情况,根据客户端命令处理情况,判断是否需要进行分区处理;对无需进行分区处理的情况,分布式存储系统直接采用EPaxos共识算法处理客户端命令;对需要进行分区处理的情况,分布式存储系统先生成相应的分区方案,再根据具体的分区方案协调副本处理流程,进行分区处理。
为实现上述目标,具体实现步骤如下:
(1)各副本采用EPaxos共识算法处理客户端命令;
(2)实时监控客户端命令的处理情况:
分布式存储系统每隔t秒从各副本r处收集四元消息(r,Ki,Tr,i,Sr,i);其中,r∈[1,N],N表示分布式存储系统中副本总数;Ki表示副本收到的客户端命令的关键字,i∈[1,I],I表示分布式存储系统中关键字总数;Tr,i表示副本r收到并提交的关键字为Ki的客户端命令总数;Sr,i表示副本r收到并提交的关键字为Ki的客户端命令中执行SlowPath阶段的命令数量;
(3)判断是否需要进行分区处理:
对于每个关键字Ki,i∈[1,I],当不进行分区处理时,系统中传递的消息总数M1i可表示为:
Figure BDA0002017824110000021
当进行分区处理时,系统中传递的消息总数M2i可表示为:
Figure BDA0002017824110000022
其中,
Figure BDA0002017824110000023
表示分布式存储系统可以容忍的最大故障副本数;R表示具有关键字Ki处理权的副本;从系统传递的消息总数来看,当M2i<M1i时,即:
Figure BDA0002017824110000024
时,关键字Ki宜进行分区处理;考虑分区处理还需消耗少量系统资源,将Ki进行分区处理的条件转化为
Figure BDA0002017824110000025
即:当Ki满足
Figure BDA0002017824110000026
时,进行分区处理;否则,不进行分区处理;若分布式存储系统中存在需进行分区处理的关键字,转至步骤(4);否则,转至步骤(1);
(4)生成分区方案:
(4.1)对需进行分区处理的每个关键字Ki,分布式存储系统计算
Figure BDA0002017824110000027
Figure BDA0002017824110000028
的差值Δi以及Tr,i的方差σi,r∈[1,N];并初始化各副本r目前所需处理的客户端命令数Dealr
(4.2)分布式存储系统对需进行分区处理的关键字Ki进行优先级排序:首先按Δi降序排列;在Δi相同的情况下,按σi升序排列;关键字排序越靠前,优先级越高;
(4.3)对需进行分区处理的关键字,分布式存储系统按优先级从高到低的顺序依次分配处理权给特定副本,构成分区方案,将分区方案发送给系统中所有副本;
(5)进行分区处理:
副本收到分区方案后,对收到的客户端命令,查看关键字是否在分区方案中;当关键字在分区方案中,进行分区处理,即:将客户端命令转发给分区方案中具有该关键字处理权的副本,具有处理权的副本采用EPaxos共识算法处理客户端命令;当关键字不在分区方案中,副本直接采用EPaxos共识算法处理客户端命令;
(6)转至步骤(2)。
本发明具有以下优点:
(1)本发明将分区处理的思想引入分布式存储系统共识算法中,在系统性能随客户端命令冲突的增多而下降时,采用分区处理策略,可获得更优的延迟与吞吐量性能;
(2)本发明根据不同的客户端环境,生成不同的分区策略,更能适应实际应用中变化的客户端环境。
附图说明
图1是本发明算法的整体流程图;
图2是EPaxos算法的流程图;
图3是副本数为3时分布式存储系统中各个副本处的客户端感知到的延迟状况图;
图4是副本数为5时分布式存储系统中各个副本处的客户端感知到的延迟状况图;
图5是客户端命令大小为1KB,副本数为3时分布式存储系统吞吐量性能图;
图6是客户端命令大小为1KB,副本数为5时分布式存储系统吞吐量性能图;
图7是客户端命令大小为16B,副本数为3时分布式存储系统吞吐量性能图;
图8是客户端命令大小为16B,副本数为5时分布式存储系统吞吐量性能图;
图9是客户端命令大小为16B,副本数为5,具有相关性的命令分散到5个关键字时,分布式存储系统吞吐量性能图。
具体实施方式
一、基础理论介绍
1.EPaxos算法
EPaxos以集群内高吞吐量和广域网环境下低延迟为设计目标,在少数副本(F个,
Figure BDA0002017824110000041
其中,N为副本总数)故障的情况下,依然能保证整体系统的可靠性。
图2表示EPaxos算法具体处理流程:客户端一般情况下提交命令给最近的副本RL(以减少延迟)。副本RL收到客户端的命令,和
Figure BDA0002017824110000042
个副本进行一轮消息交流(包括RL本身,图2中FastPath阶段)。若
Figure BDA0002017824110000043
个副本关于客户端命令中的某些信息产生分歧(即客户端命令存在冲突),副本RL将再和F+1个副本进行一轮消息交流(图2中SlowPath阶段)。之后,RL可回复客户端同时通知其余副本,命令成功提交。
2.EPaxos算法性能分析
EPaxos采取所有副本均可和客户端交互(一般情况下,客户端选择最近的副本交互,以减少延迟)的策略,不存在单领导者性能瓶颈问题。在客户端命令无冲突的情况下,只需执行FastPath阶段即可提交命令。这使得相对其他Multi-Paxos算法变种,EPaxos具有更好的系统性能。但EPaxos在不同副本处并发客户端命令相关(访问同一关键字)时,易产生冲突,这时需再执行一轮SlowPath阶段,对系统性能产生影响。
二、本发明一种基于分区处理共识算法的分布式存储系统优化方法
参照图1,本发明的具体实施步骤包括如下:
步骤1.分布式存储系统中各副本采用EPaxos共识算法处理客户端命令。
步骤2.实时监控客户端命令的处理情况
分布式存储系统每隔t秒(t的取值可根据实际应用中分布式存储系统对分区处理的灵敏度需求以及可使用资源的具体情况决定,本发明实验中将t设置为3秒)从各副本r处收集四元消息(r,Ki,Tr,i,Sr,i)。其中,r∈[1,N],N表示分布式存储系统中副本总数;Ki表示副本收到的客户端命令的关键字,i∈[1,I],I表示分布式存储系统中关键字总数;Tr,i表示副本r收到并提交的关键字为Ki的客户端命令总数;Sr,i表示副本r收到并提交的关键字为Ki的客户端命令中执行SlowPath阶段的命令数量。
步骤3.判断是否需要进行分区处理
对于每个关键字Ki,i∈[1,I],当不进行分区处理时,系统中传递的消息总数M1i可表示为:
Figure BDA0002017824110000044
当进行分区处理时,系统中传递的消息总数M2i可表示为:
Figure BDA0002017824110000051
其中,
Figure BDA0002017824110000052
表示分布式存储系统可以容忍的最大故障副本数;R表示具有关键字Ki处理权的副本。
Figure BDA0002017824110000053
Figure BDA0002017824110000054
的计算,分两种不同的情况:当关键字Ki在当前t秒内不进行分区处理时,直接计算
Figure BDA0002017824110000055
Figure BDA0002017824110000056
当关键字Ki在当前t秒内进行分区处理时,直接计算
Figure BDA0002017824110000057
按下式计算(其中Trm,i=max{Tr,i,r∈[1,N]}):
Figure BDA0002017824110000058
从系统传递的消息总数来看,当M2i<M1i时,即:
Figure BDA0002017824110000059
时,关键字Ki宜进行分区处理;考虑分区处理还需消耗少量系统资源,将Ki进行分区处理的条件转化为
Figure BDA00020178241100000510
即:当Ki满足
Figure BDA00020178241100000511
时,进行分区处理;否则,不进行分区处理;若分布式存储系统中存在需进行分区处理的关键字,转至步骤(4);否则,转至步骤(1)。
步骤4.生成分区方案
(4.1)对需进行分区处理的每个关键字Ki,分布式存储系统计算
Figure BDA00020178241100000512
Figure BDA00020178241100000513
的差值Δii越大,分区处理对系统性能提升的程度越大)以及Tr,i的方差σi,r∈[1,N](σi越小,客户端命令发生冲突的概率越大,分区处理的紧迫性越高)。并初始化各副本r目前所需处理的客户端命令数Dealr
(4.2)考虑关键字分区处理对系统性能提升的程度以及紧迫性,分布式存储系统对需进行分区处理的关键字Ki进行优先级排序:首先按Δi降序排列;在Δi相同的情况下,按σi升序排列。关键字排序越靠前,优先级越高;
(4.3)考虑各副本处需进行分区处理的关键字Ki的客户端命令数,分布式存储系统初始化各副本r的分配指数Oi,r
Oi,r=p*(Tr,i/max{Tr,i,r∈[1,N]})
其中,p为权重,0<p<1,本发明实验中,将p设置为0.8,实际应用中,可根据客户端命令的情况对p进行调整;副本分配指数Oi,r越高,越有希望获得关键字Ki的处理权;
(4.4)分布式存储系统按优先级从高到低的顺序依次分配关键字处理权,构成分区方案,并将分区方案发送给系统中所有副本。在分配关键字Ki的处理权时,需考虑副本的负载能力,首先分布式存储系统从N个副本中,选出负载尚未饱和的副本,即:满足
Figure BDA0002017824110000061
的副本,Ar表示副本r在t秒内能处理的最大命令数,根据本发明实验副本的配置,在客户端命令大小为1KB时,本发明实验将Ar设置为15000;在客户端命令大小为16B时,本发明实验将Ar设置为30000。当不存在满足条件的副本时,关键字Ki不进行分区处理,分布式存储系统更新Dealr,令Dealr=Dealr+Tr,i,r∈[1,N];当存在满足条件的副本时,分布式存储系统将关键字Ki的处理权分配给选出的副本中分配指数Oi,r最大的副本R,将(Ki,R)二元组放入分区方案中,并更新DealR,令
Figure BDA0002017824110000062
同时考虑实际应用中相邻关键字经常一起被访问,将相邻关键字处理权因素加入副本的分配指数中,即:当关键字Ki-1也需进行分区处理且处理权尚未分配,并且Oi-1,R未更新过,进行如下更新:Oi-1,R=Oi-1,R+(1-p);当关键字Ki+1也需进行分区处理且处理权尚未分配,并且Oi+1,R未更新过,进行如下更新:Oi+1,R=Oi+1,R+(1-p)。
步骤5.进行分区处理
副本收到分区方案后,对收到的客户端命令,查看关键字是否在分区方案中。当关键字在分区方案中,进行分区处理,即:将客户端命令转发给分区方案中具有该关键字处理权的副本,具有处理权的副本采用EPaxos共识算法处理客户端命令;当关键字不在分区方案中,副本直接采用EPaxos共识算法处理客户端命令。
步骤6.转至步骤2。
本发明的效果可通过以下仿真实验进一步说明。
1.仿真平台及配置
本仿真实验运行在亚马逊EC2平台,客户端实例和分布式存储系统副本实例配置如下:1个2.5GHz的vCPU,1G内存,64位Ubuntu Server 18.04操作系统。延迟实验中,在分布式存储系统包含3个副本时,将3个副本分别部署在加利福尼亚北部(California,CA),弗吉尼亚北部(Virginia,VA)和爱尔兰(Ireland,IE);在分布式存储系统包含5个副本时,将另外两个副本部署在俄勒冈(Oregon,OR)和东京(Tokyo,TKY)。延迟实验中的所有副本实例处同时也设置了客户端实例,客户端发送命令给分布式存储系统,在收到前一条命令的回复之后才会发送后一条命令。吞吐量实验中,分布式存储系统所有副本和客户端均部署在同一数据中心,客户端按批发送命令给分布式存储系统(分布式存储系统处理客户端命令时,副本之间的消息传递不按批进行),测量收到回复的速率。为全面评估吞吐量性能,本仿真实验分别将客户端命令大小设置为1KB(网络受限系统)和16B(处理器受限系统)进行吞吐量实验。为模拟客户端命令冲突的情况,本仿真实验在客户端发送的命令中设置相关命令,每个客户端发送的具有相关性的命令所占百分比越多,相关的并发客户端命令越多,客户端命令发生冲突的概率越大。本仿真实验采用节俭模式:在节俭模式下,分布式存储系统处理客户端命令时,副本将消息发送给一定数量(法定人数)的副本,而不是全部副本。
2.仿真内容及结果分析
实验1延迟实验
图3是分布式存储系统包含3个副本时,各副本处的客户端感知到的延迟状况图,包括中位数延迟以及90%ile延迟。此时EPaxos不受具有相关性的命令所占百分比的影响,执行Fast path阶段即可提交命令(节俭模式导致),本发明不进行分区处理,延迟性能和基于EPaxos共识算法的分布式存储系统延迟性能大致相同。
图4是分布式存储系统包含5个副本时,各副本处的客户端感知到的延迟状况图,包括中位数延迟以及90%ile延迟。此时随着相关的并发客户端命令增多(具有相关性的命令所占百分比增大),客户端命令冲突增多,对系统性能产生影响。本发明采取分区处理的方法,总体延迟性能要优于基于EPaxos共识算法的分布式存储系统。
实验2吞吐量实验
图5和图6是客户端命令大小为1KB(网络受限系统)时分布式存储系统吞吐量性能图,包括平均吞吐量以及95%CI吞吐量。图5是副本数为3的情况,图6是副本数为5的情况。副本数为3时,EPaxos不受具有相关性的命令所占百分比的影响,执行Fast path阶段即可提交命令(节俭模式导致),本发明不进行分区处理,吞吐量性能和基于EPaxos共识算法的分布式存储系统吞吐量性能无明显差异。副本数为5时,由于网络受限系统吞吐量性能主要受制于副本之间客户端命令的传播,客户端命令冲突对分布式存储系统吞吐量的影响较小。本发明和基于EPaxos共识算法的分布式存储系统吞吐量性能无明显差异。
图7和图8是客户端命令大小为16B(处理器受限系统)时分布式存储系统吞吐量性能图,包括平均吞吐量以及95%CI吞吐量。图7是副本数为3的情况,图8是副本数为5的情况。副本数为3时,EPaxos不受具有相关性的命令所占百分比的影响,执行Fast path阶段即可提交命令(节俭模式导致),本发明不进行分区处理,吞吐量性能和基于EPaxos共识算法的分布式存储系统吞吐量性能无明显差异。副本数为5时,随着相关的并发客户端命令增多(具有相关性的命令所占百分比增大),客户端命令冲突增多,对系统性能产生影响。本发明采用分区处理的方法。在相关命令所占百分比为2%时,由于相关命令所占百分比较小,从分布式存储系统整体吞吐量来看,本发明和基于EPaxos共识算法的分布式存储系统吞吐量性能大致相同。在相关命令所占百分比25%和100%时,由于具有相关性的命令均访问同一关键字,本发明在生成分区方案时,不存在满足
Figure BDA0002017824110000081
的副本,不进行分区处理,和基于EPaxos共识算法的分布式存储系统吞吐量性能大致相同。
图9是客户端命令大小为16B(处理器受限系统),副本数为5,具有相关性的命令分散到5个关键字时,分布式存储系统吞吐量性能图,包括平均吞吐量以及95%CI吞吐量。此时,由于具有相关性的命令分散到不同的关键字上,当相关命令所占百分比为25%和100%时,本发明副本负载未饱和,可进行分区处理,吞吐量性能要优于基于EPaxos共识算法的分布式存储系统。本发明根据并发客户端命令冲突情况和副本负载情况决定是否进行分区处理,实质上与具有命令冲突的关键字个数无关,故这里选取5个关键字作为副本负载未饱和的代表,不再讨论其他关键字个数情况。
从实验结果图可以明显看出,本发明在客户端命令冲突影响分布式存储系统性能的情况下,提升了系统的延迟与吞吐量性能,能更好地适应不同的客户端环境。

Claims (3)

1.一种基于分区处理共识算法的分布式存储系统优化方法,其特征在于,包括如下步骤:
(1)各副本采用EPaxos共识算法处理客户端命令;
(2)实时监控客户端命令的处理情况:
分布式存储系统每隔t秒从各副本r处收集四元消息(r,Ki,Tr,i,Sr,i);其中,r∈[1,N],N表示分布式存储系统中副本总数;Ki表示副本收到的客户端命令的关键字,i∈[1,I],I表示分布式存储系统中关键字总数;Tr,i表示副本r收到并提交的关键字为Ki的客户端命令总数;Sr,i表示副本r收到并提交的关键字为Ki的客户端命令中执行SlowPath阶段的命令数量;
(3)判断是否需要进行分区处理:
对于每个关键字Ki,i∈[1,I],当不进行分区处理时,系统中传递的消息总数M1i表示为:
Figure FDA0002988244030000011
当进行分区处理时,系统中传递的消息总数M2i表示为:
Figure FDA0002988244030000012
其中,
Figure FDA0002988244030000013
表示分布式存储系统可以容忍的最大故障副本数;R表示具有关键字Ki处理权的副本;从系统传递的消息总数来看,当M2i<M1i时,即:
Figure FDA0002988244030000014
时,对关键字Ki进行分区处理;考虑分区处理还需消耗少量系统资源,将Ki进行分区处理的条件转化为
Figure FDA0002988244030000015
即:当Ki满足
Figure FDA0002988244030000016
时,进行分区处理;否则,不进行分区处理;当分布式存储系统中存在需进行分区处理的关键字时,转至步骤(4);否则,转至步骤(1);
(4)生成分区方案:
(4.1)对需进行分区处理的每个关键字Ki,分布式存储系统计算
Figure FDA0002988244030000017
Figure FDA0002988244030000018
的差值Δi以及Tr,i的方差σi,r∈[1,N];并初始化各副本r目前所需处理的客户端命令数Dealr
(4.2)分布式存储系统对需进行分区处理的关键字Ki进行优先级排序:首先按Δi降序排列;在Δi相同的情况下,按σi升序排列;关键字排序越靠前,优先级越高;
(4.3)对需进行分区处理的关键字,分布式存储系统按优先级从高到低的顺序依次分配处理权给特定副本,构成分区方案,将分区方案发送给系统中所有副本;
(5)进行分区处理:
副本收到分区方案后,对收到的客户端命令,查看关键字是否在分区方案中;当关键字在分区方案中时,进行分区处理,即:将客户端命令转发给分区方案中具有该关键字处理权的副本,具有处理权的副本采用EPaxos共识算法处理客户端命令;当关键字不在分区方案中,副本直接采用EPaxos共识算法处理客户端命令;
(6)转至步骤(2)。
2.根据权利要求书1所述的一种基于分区处理共识算法的分布式存储系统优化方法,其特征在于,步骤(3)所述的
Figure FDA0002988244030000021
Figure FDA0002988244030000022
按如下方式计算:
(3.1)当关键字Ki在当前t秒内不进行分区处理时,直接计算
Figure FDA0002988244030000023
Figure FDA0002988244030000024
(3.2)当关键字Ki在当前t秒内进行分区处理时,直接计算
Figure FDA0002988244030000025
按下式计算:
Figure FDA0002988244030000026
其中,Trm,i=max{Tr,i,r∈[1,N]}。
3.根据权利要求书1或2所述的一种基于分区处理共识算法的分布式存储系统优化方法,其特征在于,步骤(4.3)所述的对需进行分区处理的关键字,分布式存储系统按优先级从高到低的顺序依次分配处理权给特定副本,按如下过程进行:
(A)对需进行分区处理的每个关键字Ki,分布式存储系统初始化各副本r的分配指数Oi,r
Oi,r=p*(Tr,i/max{Tr,i,r∈[1,N]})
其中,p为权重,0<p<1;副本分配指数Oi,r越高,越有希望获得关键字Ki的处理权;
(B)分布式存储系统按优先级从高到低的顺序依次分配关键字处理权:
对关键字Ki,分布式存储系统从N个副本中,选出负载尚未饱和的副本,即:满足
Figure FDA0002988244030000027
的副本,Ar表示副本r在t秒内能处理的最大命令数;当不存在满足条件的副本时,关键字Ki不进行分区处理,分布式存储系统更新Dealr,令Dealr=Dealr+Tr,i,r∈[1,N];当存在满足条件的副本时,分布式存储系统将关键字Ki的处理权分配给选出的副本中分配指数Oi,r最大的副本R,并更新DealR,令
Figure FDA0002988244030000031
同时考虑实际应用中相邻关键字经常一起被访问,将相邻关键字处理权因素加入副本的分配指数中,即:当关键字Ki-1也需进行分区处理且处理权尚未分配,并且Oi-1,R未更新过,进行如下更新:Oi-1,R=Oi-1,R+(1-p);当关键字Ki+1也需进行分区处理且处理权尚未分配,并且Oi+1,R未更新过,进行如下更新:Oi+1,R=Oi+1,R+(1-p)。
CN201910269201.4A 2019-04-04 2019-04-04 一种基于分区处理共识算法的分布式存储系统优化方法 Active CN109947375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910269201.4A CN109947375B (zh) 2019-04-04 2019-04-04 一种基于分区处理共识算法的分布式存储系统优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910269201.4A CN109947375B (zh) 2019-04-04 2019-04-04 一种基于分区处理共识算法的分布式存储系统优化方法

Publications (2)

Publication Number Publication Date
CN109947375A CN109947375A (zh) 2019-06-28
CN109947375B true CN109947375B (zh) 2021-05-14

Family

ID=67013742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910269201.4A Active CN109947375B (zh) 2019-04-04 2019-04-04 一种基于分区处理共识算法的分布式存储系统优化方法

Country Status (1)

Country Link
CN (1) CN109947375B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105814544A (zh) * 2013-12-13 2016-07-27 甲骨文国际公司 用于支持分布式数据网格中的持久化分区发现的系统和方法
CN106534227A (zh) * 2015-09-09 2017-03-22 阿里巴巴集团控股有限公司 用于扩展分布式一致性服务的方法和设备
CN108170763A (zh) * 2017-12-25 2018-06-15 江南大学 一种低延迟的分布式计算共识算法
CN109491968A (zh) * 2018-11-13 2019-03-19 浙江鲸腾网络科技有限公司 一种文件处理方法、装置、设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10229009B2 (en) * 2015-12-16 2019-03-12 Netapp, Inc. Optimized file system layout for distributed consensus protocol

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105814544A (zh) * 2013-12-13 2016-07-27 甲骨文国际公司 用于支持分布式数据网格中的持久化分区发现的系统和方法
CN106534227A (zh) * 2015-09-09 2017-03-22 阿里巴巴集团控股有限公司 用于扩展分布式一致性服务的方法和设备
CN108170763A (zh) * 2017-12-25 2018-06-15 江南大学 一种低延迟的分布式计算共识算法
CN109491968A (zh) * 2018-11-13 2019-03-19 浙江鲸腾网络科技有限公司 一种文件处理方法、装置、设备及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Elastic Paxos: A Dynamic Atomic Multicast Protocol;Samuel Benz;《IEEE》;20170717;全文 *
MEPaxos_低延迟的共识算法;赵守月;《计算机科学与探索》;20180626;第13卷(第5期);第866-874页 *
基于副本状态机的分布式一致性算法研究;肖茜文;《中国优秀硕士学位论文全文数据库 信息科技辑》;20181215;第I138-11页 *

Also Published As

Publication number Publication date
CN109947375A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
US10990561B2 (en) Parameter server and method for sharing distributed deep learning parameter using the same
US8046425B1 (en) Distributed adaptive network memory engine
US9465770B2 (en) Scheduling and execution of DAG-structured computation on RDMA-connected clusters
US10826990B2 (en) Clustered storage system configured for bandwidth efficient processing of writes at sizes below a native page size
US20200401315A1 (en) Storage system configured to support one-to-many replication
US20170091668A1 (en) System and method for network bandwidth aware distributed learning
CN114861911B (zh) 深度学习模型的训练方法、装置、系统、设备和介质
US20220335564A1 (en) Resiliency Schemes for Distributed Storage Systems
US20210035020A1 (en) Machine learning systems and methods for data placement in distributed storage
US11137929B2 (en) Storage system configured to support cascade replication
US10922147B2 (en) Storage system destaging based on synchronization object with watermark
US7379952B2 (en) Techniques for multiple window resource remastering among nodes of a cluster
CN109947375B (zh) 一种基于分区处理共识算法的分布式存储系统优化方法
US11093161B1 (en) Storage system with module affinity link selection for synchronous replication of logical storage volumes
Hines et al. Distributed anemone: Transparent low-latency access to remote memory
CN109254844B (zh) 一种大规模图的三角形计算方法
US20230022689A1 (en) Efficient Networking for a Distributed Storage System
US10474545B1 (en) Storage system with distributed input-output sequencing
US20220309011A1 (en) On-chip interconnect for memory channel controllers
KR101718739B1 (ko) 이기종 하둡을 위한 동적 데이터 복제 시스템 및 방법
Kumar et al. HDC-hot data caching in mobile database systems
Ravikumar et al. Staleness and stagglers in distibuted deep image analytics
WO2023151216A1 (zh) 图数据处理的方法和芯片
US11106365B1 (en) Flow control of input/output (IO) in a synchronous replication session
WO2021184304A1 (zh) 分布式编译缓存方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230511

Address after: 510000 Building 1, No. 106 Fengze East Road, Nansha District, Guangzhou City, Guangdong Province X1301-G022220 (Cluster Registration) (JM)

Patentee after: Guangzhou Kaimeng Technology Co.,Ltd.

Address before: 2081, building a, 88 Jianghai West Road, Liangxi District, Wuxi City, Jiangsu Province, 214000

Patentee before: Wuxi Xiangyuan Information Technology Co.,Ltd.

Effective date of registration: 20230511

Address after: 2081, building a, 88 Jianghai West Road, Liangxi District, Wuxi City, Jiangsu Province, 214000

Patentee after: Wuxi Xiangyuan Information Technology Co.,Ltd.

Address before: 1800 No. 214122 Jiangsu city of Wuxi Province Li Lake Avenue

Patentee before: Jiangnan University