CN110138863B - 基于Multi-Paxos分组的自适应一致性协议优化方法 - Google Patents

基于Multi-Paxos分组的自适应一致性协议优化方法 Download PDF

Info

Publication number
CN110138863B
CN110138863B CN201910408554.8A CN201910408554A CN110138863B CN 110138863 B CN110138863 B CN 110138863B CN 201910408554 A CN201910408554 A CN 201910408554A CN 110138863 B CN110138863 B CN 110138863B
Authority
CN
China
Prior art keywords
data center
consistency
main
grouping
paxos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910408554.8A
Other languages
English (en)
Other versions
CN110138863A (zh
Inventor
王野
王奕真
顾术实
张钦宇
梁永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201910408554.8A priority Critical patent/CN110138863B/zh
Publication of CN110138863A publication Critical patent/CN110138863A/zh
Application granted granted Critical
Publication of CN110138863B publication Critical patent/CN110138863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于Multi‑Paxos分组的自适应一致性协议优化方法,将数据中心划分为主分组和辅助分组,当客户端发送一个请求到一个数据中心时,只先将客户端的请求内容发送给主分组的数据中心。本发明的有益效果是:减少了延迟并提高了吞吐量。

Description

基于Multi-Paxos分组的自适应一致性协议优化方法
技术领域
本发明涉及分布式存储,尤其涉及一种基于Multi-Paxos分组的自适应一致性协议优化方法。
背景技术
跨地域的广域分布式存储系统正成为社交网络、电子商务等大规模应用的首选平台。此类存储系统通常将数据在多个数据中心之间复制存储,客户端可以在本地请求来自最近数据中心内的数据并获得快速的响应[1]。更重要的是,通过在不同地理区域中冗余复制可以在全球范围内实现数据持久化、容错和容灾等功能。具体实例有Google’s CloudSpanner[2]、Azure’s Cosmos DB[3]等。
伴随着数据复制产生的一个重大问题是如何保证各数据中心副本的数据一致性[4][5]。数据一致性问题在分布式系统已经得到了广泛的研究,并且有许多不同水平的一致性保证如强一致性[6]、最终一致性[7]等已经被提出。最初,系统的复制服务只能选择一种一致性水平,若选择强一致性就必须忍受影响用户体验的高时延,若选择最终一致性就必须承受数据不一致的惩罚。随着应用类型的增加,系统不再满足于单一的一致性水平。因此,像Cassandra和Dynamo这样的存储服务都开始为用户提供多种一致性水平以供选择。更进一步的,学者们将一致性水平连续化成0-100%而不再是只有几个选择,并对实现系统根据应用的不同自适应的选择最佳一致性水平,进行了大量的研究[10]。
在[8]中,Harmany通过收集存储系统相关信息并计算过期读取操作的比率来定义应用程序的一致性级别。在[9]中,Pileus使用数值误差,排序误差和到期作为指标来自适应地选择一致性水平,并选择延迟更新传播方法来同步DC。在[10]中,提出了概率CAP(PCAP)来实时自适应地调整一致性并改变网络状况。作者尽可能地提高一致性以满足延迟要求,同时减少延迟以满足一致性要求。在[11]中,作者引入了概率模型来捕获工作负载,网络延迟和客户端观察到的一致性之间的关系。然后,他们基于测量和数学建模实现权衡结果。
然而,在带宽受限的大环境下,现有的自适应一致性方案无论选择何种一致性水平,所依赖的协议都是将请求内容发送给全部的数据中心[12],在传输能力不足的情况下,即便较低的一致性水平都存在较高的时延。同时,现有方案中没有考虑数据中心间的差异性,只要已同步的数据中心数量达到所需一致性的要求就认为执行完成。
广域分布式存储系统依赖数据复制实现系统的可靠性,数据复制存在的一个主要挑战是数据一致性。随着应用种类的增加,系统的数据一致性水平已由传统的强一致和最终一致性等单一的一致性水平发展到能够根据应用的不同自适应的选择最佳一致性水平。但是,现有的自适应一致性方案大多基于传统的数据一致性协议,在带宽受限的情况下不考虑数据中心的多样性,时延高、用户体验差。然而,现有的自适应一致性方案主要依赖于传统的最终一致性协议,例如Multi-Paxos,同时他们很少考虑DC(Data Center)的多样性,这导致高延迟和低吞吐量。
因此,如何提供一种新的自适应一致性方案,以减少延迟并提高吞吐量是本领域技术人员所亟待解决的技术问题。
参考文献如下:
[1]Z.Hu et al.,The need for end-to-end evaluation of cloudavailability.in Passive and Active Measurement.15th International Conference,PAM 2014,Los Angeles,CA,USA,Mar.2014,pp.119 30.
[2]D.F.Bacon et al.,Spanner:Becoming a sql system,in Proceedings ofthe 2017ACM International Conference on Management of Data,Chicago,Illinois,USA,May 2017,pp.331 343.
[3]R.Ramakrishnan et al.,Azure data lake store:A hyperscaledistributed file service for big data analytics,in Proceedings of the 2017ACM International Conference on Management of Data,Chicago,Illinois,USA,May2017,pp.51 63.
[4]D.D.Akkoorath,V.F ord os,and A.Bieniusa,Observing the consistencyof distributed systems,in Proceedings of the 15th International Workshop onErlang,Nara,Japan,Sept.2016,pp.54 55.[5]Z.Wu,E.Wijaya,M.Uluyol,andH.V.Madhyastha,Bolt-on global consistency for the cloud,in Proceedings of theACM Symposium on Cloud Computing,Seattle,WA,USA,Oct.2018,pp.55 67.
[6]Z.Wu,E.Wijaya,M.Uluyol,and H.V.Madhyastha,Bolt-on globalconsistency for the cloud,in Proceedings of the ACM Symposium on CloudComputing,Seattle,WA,USA,Oct.2018,pp.55 67.
[7]W.Vogels,Eventually consistent,Queue,vol.6,no.6,pp.14 19,Oct.2008.
[8]H.Chihoub,S.Ibrahim,G.Antoniu,and M.S.Prez,Harmony:Towardsautomated self-adaptive consistency in cloud storage,in Proceedings of the2012IEEE International Conference on Cluster Computing,Washington,DC,USA,Sept.2012,pp.293 301.
[9]D.Terry,V.Prabhakaran,R.Kotla,M.Balakrishnan,Aguilera,and M.K.,Transactions with consistency choices on georeplicated cloud storage,Tech.Rep.,Sept.2013.[Online].Available:https://www.microsoft.com/en-us/research/publication/transactions-with-consistency-choices-on-geo-replicated-cloud-storage.
[10]M.R.Rahman,L.Tseng,S.Nguyen,I.Gupta,and N.Vaidya,Characterizingand adapting the consistency-latency tradeoff in distributed key-valuestores,ACM Trans.Auton.Adapt.Syst.,vol.11,no.4,pp.1 36,Jan.2017.
[11]M.R.Rahman,L.Tseng,S.Nguyen,I.Gupta,and N.Vaidya,Characterizingand adapting the consistency-latency tradeoff in distributed key-valuestores,ACM Trans.Auton.Adapt.Syst.,vol.11,no.4,pp.1 36,Jan.2017.
[12]L.Lamport,Paxos made simple,Acm Sigact News,vol.32,no.4,pp.18 25,2001.
发明内容
为了解决现有技术中的问题,本发明提供了一种基于Multi-Paxos分组的自适应一致性协议优化方法。
本发明提供了一种基于Multi-Paxos分组的自适应一致性协议优化方法,将数据中心划分为主分组和辅助分组,当客户端发送一个请求到一个数据中心时,只先将客户端的请求内容发送给主分组的数据中心。
作为本发明的进一步改进,在主分组的数据中心完成同步后认为请求执行完成,再在带宽空闲期,将请求内容发送给辅助分组的数据中心。
作为本发明的进一步改进,根据数据中心副本一致性程度、相关性程度和传输平均时延三个指标动态规划主分组,通过构建优化函数设计分组算法求解出唯一最佳主分组,实现自适应一致性。
作为本发明的进一步改进,数据中心副本一致性程度、相关性程度和传输平均时延三个指标具体定义如下:
定义1:假设单个数据中心到其他数据中心的传输时延分别为t1、t2、……tn-1、,定义单个数据中心的平均时延t为该数据中心到其他数据中心传输时延总和与总数据中心个数N的比值;
Figure BDA0002062064230000041
传输时延越小,系统响应时间越短,可用性越好;
定义2:定义单个数据中心的一致性程度s为已处理的请求数Qcomplete与客户端总请求数Qsum的比值;
Figure BDA0002062064230000042
一致性程度高则该数据中心未实现同步的请求较少,新的请求能较快
的得到执行;
定义3:定义单个数据中心的相关性程度r为一段时间内访问该数据中心的访问量VDB与总访问量Vsum的比值;
Figure BDA0002062064230000043
相关性程度高,则系统的可靠性高。
作为本发明的进一步改进,每一个数据中心均有数据中心副本一致性程度、相关性程度和传输平均时延三个指标,将这三个指标与一个公式结合得到效率指标,效率指标定义如下:
定义4:定义单个数据中心的分组效率指标e为本数据中心的相关性程度和传输时延与等待时延的比值;
Figure BDA0002062064230000044
其中,β为系统参数,用效率指标评判数据中心成为主分组的优先程度及该数据中心在集群里所占的权重,即决策权的大小;
定义主分组中数据中心的效率指标总和必须大于所有数据中心总和的一半,以确保同时没有两个主分组,要求主分组的数量不超过所有数据中心数量的一半,可以减少请求的响应时间,由于数据中心的效率指标不同,因此,可以保证即使主分组的数量小于所有数据中心的数量的一半,效率指标的总和仍然可以超过所有数据中心的总和的一半,并且可以保证主分组的唯一性;
根据上述要求,得到多个符合条件的集合,因此,构建一个优化目标函数,通过权衡效率指标和主要群体的数量,找到满足高效率指标的最佳主分组,并且主分组的数量要尽可能小,优化目标函数如下。
Figure BDA0002062064230000051
s.t.e·j≥E’
Figure BDA0002062064230000052
这里,e是各数据中心效率指标e组成的向量,表示为:
e=[e1,e2,…eN]
j是反映各数据中心是否属于主分组的向量,表示为:
j=[j1,j2,…jN],其中ji∈[0,1],i=0,1,…N,
其中1表示该数据中心处于主分组内,0表示该数据中心处于主分组外;Pc是指系统中该请求已完成同步的数据中心与全部数据中心的百分比,表示为:
Figure BDA0002062064230000053
其中,∝为系统参数,E’是约束条件,代表全部数据中心效率指标总和的一半,选择的主分组必须满足超过此阈值才能代表多数派,保证两个分组的最终一致;Ec具体表现形式:
Figure BDA0002062064230000054
将e·j-Pc定义为效率函数F,通过找到满足约束条件的向量中,满足效率函数F最大的向量j作为主分组。
作为本发明的进一步改进,所述分组算法包括:当客户端向系统提出请求时,首先求出系统中各数据中心的效率指标ei,得到向量E和阈值E’,通过遍历所有的J可能存在的形式,找到满足能代表多数派前提下实现效率函数F最高的j向量,从该j向量就可得知具体主分组由哪些数据中心组成。
本发明的有益效果是:提供了一种基于Multi-Paxos分组的自适应一致性协议优化方法,减少了延迟并提高了吞吐量。
附图说明
图1是本发明一种基于Multi-Paxos分组的自适应一致性协议优化方法的分组示意图。
图2是本发明一种基于Multi-Paxos分组的自适应一致性协议优化方法的系统内部示意图。
图3是本发明一种基于Multi-Paxos分组的自适应一致性协议优化方法的流程图。
图4是GM-Paoxs与Multi-Paxos的平均时延对比图。
图5是GM-Paoxs与Multi-Paxos的吞吐量对比图。
具体实施方式
下面结合附图说明及具体实施方式对本发明作进一步说明。
如图1所示,广域网下分布N个数据中心(DC),每个数据中心都给若干客户端提供服务。当客户端发送一个请求到一个数据中心时,传统的Multi-Paxos协议要求该数据中心将请求内容发送给其他全部数据中心,且当半数以上数据中心回复后认为请求执行完成。在带宽受限的情况将很快达到带宽上限,系统性能较差。因此,本发明提供了一种基于Multi-Paxos分组的自适应一致性协议Grouping Multi-Paxos(GM-Paxos)优化方法,考虑在数据中心接收到客户端请求后,只先将请求内容发送给部分数据中心,且在这些数据中心完成同步后认为请求执行完成。在带宽允许的情况下再将请求内容发送给其他数据中心。本发明将这些数据中心归为主分组,其他数据中心归为辅助分组。如何选择主分组内的的数据中心是一个重点,且主分组数据中心的个数决定了该请求的一致性水平。
因为数据中心分布在各地,处理请求的能力,通信的环境等都有所不同,因此我们认为数据中心是有差异性的,我们可以通过数据中心的差异性来选择主分组。在数据复制的过程中,时延是直接影响用户体验的,因此最受关注。不同的数据中心距离不同,通信质量不同,传输时延就会不同。我们可以选择传输时延作为一个指标。数据中心的处理能力也十分重要,未处理请求越多,则排队执行请求的时间就越长,数据中心的一致性程度越低。因此,我们将一致性程度作为一个指标。同时,数据中心对于不同的请求内容敏感度不同,部分数据中心对该数据的实时性要求高,访问量大,那么需要考虑优先同步这些数据中心,保证系统的可靠性。所以我们将相关程度也作为一个指标。综上所述,我们选择传输时延、数据中心一致性程度和相关程度作为选择主分组的三个指标,具体定义如下:
定义1:假设单个数据中心到其他数据中心的传输时延分别为t1、t2、……tn-1、,定义单个数据中心的平均时延t为该数据中心到其他数据中心传输时延总和与总数据中心个数N的比值;
Figure BDA0002062064230000071
传输时延越小,系统响应时间越短,可用性越好;
定义2:定义单个数据中心的一致性程度s为已处理的请求数Qcomplete与客户端总请求数Qsum的比值;
Figure BDA0002062064230000072
一致性程度高则该数据中心未实现同步的请求较少,新的请求能较快的得到执行;
定义3:定义单个数据中心的相关性程度r为一段时间内访问该数据中心的访问量VDB与总访问量Vsum的比值;
Figure BDA0002062064230000073
相关性程度高,则系统的可靠性高。
系统的内部结构如图2所示。不同的DC具有不同的特性。就一致性程度而言,阴影部分表示已处理的交易,而白色部分表示未处理的交易。阴影部分的比例越大,导致稠度程度越高。相关度r由连接到DC的客户端的数量表示。如果客户端数量很大,则相关度很高。平均传输延迟t直接由两个DC之间的距离表示,并且如果一个DC远离大多数DC,则它的延迟很大。根据这三个指标,我们可以选择几个具有高一致性,高相关度和低平均传输延迟的DC作为主要组,这将提高一致性水平和可用性。需要注意的是,主要群体必须能够代表多数人,以保证决策的唯一性。
GM-Paxos的系统流程图如图3所示,系统中分配了7个DC,命名为A到G。
整个系统流程大致如图3:客户端发送请求到最近的数据中心G,数据中心先从管理者D处获得最新的各个指标数值,通过计算得到主分组由B、C组成,G将请求发送给主分组内的数据中心,在收到B和C反馈信息后向客户端反馈请求执行完成。再在带宽空闲期将请求发送给其他数据中心,系统将实现最终一致。其中,管理者D是随机选择的,其他数据中心必须定期发送单位时间内已完成的请求数、访问量和平均传输时延。
每个DC都有上述三个指标,我们将这三个指标与一个公式结合得到一个新的指标,我们把这个新指标称为效率指标。效率指标定义如下:
定义4:定义单个数据中心的分组效率指标e为本数据中心的相关性程度和传输时延与等待时延的比值。
Figure BDA0002062064230000081
其中,β为系统参数。用效率指标评判数据中心成为主分组的优先程度及该数据中心在集群里所占的权重,即决策权的大小。
我们定义主分组中DC的效率指标总和必须大于所有DC总和的一半,以确保同时没有两个主分组。我们还要求主分组的数量不超过所有DC数量的一半,这可以减少请求的响应时间。由于DC的效率指标不同,因此我们可以保证即使主分组的数量小于所有DC的数量的一半,效率指标的总和仍然可以超过所有DC的总和的一半,并且可以保证主分组的唯一性。
根据上述要求,我们可以得到多个符合条件的集合,因此我们需要构建一个优化目标函数。通过权衡效率指标和主要群体的数量,我们试图找到满足高效率指标的最佳主分组,并且主分组的数量要尽可能小。
优化目标函数如下。
Figure BDA0002062064230000082
s.t.e·j≥E’
Figure BDA0002062064230000083
这里,e是各数据中心效率指标e组成的向量,可表示为:
e=[e1,e2,…eN]
j是反映各数据中心是否属于主分组的向量,可表示为:
j=[j1,j2,…jN],其中ji∈[0,1],i=0,1,…N,
其中1表示该数据中心处于主分组内,0表示该数据中心处于主分组外。Pc是指系统中该请求已完成同步的数据中心与全部数据中心的百分比,表示为:
Figure BDA0002062064230000091
其中,∝为系统参数。E’是约束条件,代表全部数据中心效率指标总和的一半,选择的主分组必须满足超过此阈值才能代表多数派,保证两个分组的最终一致。Ec具体表现形式:
Figure BDA0002062064230000092
文中将e·j-Pc定义为效率函数F,通过找到满足约束条件的向量中,满足效率函数F最大的向量j作为主分组。
分组算法如下:
Figure BDA0002062064230000093
其中,Gp是主分组,Gs是主分组以外的数据中心组成的集合。当客户端向系统提出请求时,首先求出系统中各数据中心的效率指标ei,得到向量E和阈值E’(步骤1-4)。通过遍历所有的J可能存在的形式,找到满足能代表多数派前提下实现效率函数F最高的j向量(步骤5-12),从该j向量就可得知具体主分组由哪些数据中心组成。
在选出主分组后,GM-Paxos可以开始数据同步。与Multi-Paxos相比,我们仅同步主分组内的DC以减少响应延迟。同时,当请求完成时,需要传输的数据量将减少,系统的吞吐量将增加。
本文将通过两个证明定理来比较GM-Paxos和Multi-Paxos的延迟和吞吐量。
定理1:假设每个DC的相关度相同,则GM-Paxos的请求响应延迟T小于Multi-Paxos协议的响应延迟tmedian
证明:DC的平均传输延迟t=[t1,t2,...,tN],相关度r=[r1,r2,...,rN],一致性程度为s=[s1,s2,...,sN],请求总数为n。假设DC以v的速度处理请求,则每个DC更新到最新数据所花费的时间是
Figure BDA0002062064230000101
Multi-Paxos协议中各数据中心的总时延ttotal为:
Figure BDA0002062064230000102
因为协议是在收到半数以上数据中心的回复后认为请求已执行完成,则Multi-Paxos协议的响应时间是
Figure BDA0002062064230000103
而GM-Paoxs的响应时间是
Figure BDA0002062064230000104
其中,m指主分组,m=[m1,m2…mL],L为主分组个数。
假设
Figure BDA0002062064230000105
因为主分组内任意数据中心满足
Figure BDA0002062064230000106
Figure BDA0002062064230000107
其中,em-rest指主分组内剩余DC的效率指标,rp=rmedian此时不满足
Figure BDA0002062064230000108
因此
Figure BDA0002062064230000109
不成立,可得
Figure BDA00020620642300001010
GM-Paoxs降低时延得证。
定理2:GM-Paxos的吞吐量高于多paxos协议的吞吐量。
证明:假设系统N个数据中心的单个请求的平均大小为Sreq,确认消息的大小为Sans,数据中心回复客户端消息大小为Sack。GM-Paoxs在请求执行成功时发送的数据量D小于Multi-Paxos协议的数据量DMulti-PaxoS
在Multi-Paxos协议中,领导者发送的数据总量为(N-1)Sreq,普通节点的确认消息数据总量为
Figure BDA00020620642300001011
当请求执行完成时,Multi-Paxos协议发送的数据总量DMulti-Paxos为:
Figure BDA00020620642300001012
GM-Paoxs发送的数据总量D为:
Figure BDA0002062064230000111
因为
Figure BDA0002062064230000112
所以
Figure BDA0002062064230000113
由此可知当请求成功执行时,GM-Paxos发送的数据少于Multi-Paxos。GM-Paxos在传输能力不足的情况下,当请求执行完成时减少了数据传输,并且能够快速执行系统的不同请求。因此,当带宽相同时,单位时间内GM-Paxos可以处理比Multi-Paxos更多的请求,所以GM-Paxos的吞吐量大于Multi-Paxos协议的吞吐量。
本节通过实验评估GM-Paxos的性能,并在同一环境下与Multi-Paxos协议进行比较。具体实验参数见表1。
Figure BDA0002062064230000114
表1仿真参数的含义及取值
本文模拟了9个数据中心,设置客户端到距离最近的数据中心的延迟为1ms、所有数据中心之间是由有效带宽为1Mbps的广域网相连,传输延迟T服从均值25方差10的高斯分布以模拟实际通信环境,客户端任意分布在各个数据中心,在当前请求完成之前,客户端不会发送下一个请求。通过仿真平均时延和吞吐量等来比较性能优劣。
图4对比了GM-Paoxs与Multi-Paxos的平均时延。由图可知,GM-Paoxs的平均时延明显低于Multi-Paxos。这时因为主分组由一致性程度,相关性程度和平均传输延迟这三个指标组成,且主分组中的DC数量通常小于所有DC的一半。当请求数量很少,带宽资源充足时,所有请求都被视为同时发送。然而,一致性程度和平均传输延迟与总延迟相关,并且主分组中的DC通常具有较低的等待时间。当主分组中具有最高延迟的DC完成同步时,时间仍然比Multi-Paxos短。当客户端数量接近1000时,由于请求内容同时发送给所有DC,因此带宽已无法满足Multi-Paxos的需求。从图4可以看出,Multi-Paxos的延迟大大增加,并且无法快速完成大量请求。而我们的策略仅选择向主要组发送请求,因此我们为每个请求使用比Multi-Paxos更小的带宽。当客户端数量接近1200时,我们仍然保持低延迟。同时,我们首先将具有高相关度的DC同步,以确保具有高数据实时要求的DC可以访问最新数据。总之,GM-Paxos的平均延迟低于Multi-Paxos。且当带宽有限时,GM-Paxos的优势十分明显。
在图5中,我们比较了GM-Paoxs和Multi-Paxos的吞吐量。在图中,两条曲线在前一时期稳步上升,但GM-Paoxs吞吐量高于Multi-Paxos。这是因为我们首先只将请求内容发送到主要组而不是所有DC。当请求执行完成时,我们传输的数据量远远小于Multi-Paxos。因此,在相同的带宽条件下,GM-Paxos在单位时间可以完成更多的请求,吞吐量更大。由于带宽有限,Multi-Paxos的曲线快速趋于平缓,但GM-Paxos的曲线仍稳步上升。因此,GM-Paxos的吞吐量高于Multi-Paxos,且当传输容量不足时,优势更为明显。
本发明提供了一种基于Multi-Paxos分组的自适应一致性协议优化方法,通过代表数据中心差异性的三个指标设计RG算法为客户端请求选出部分数据中心作为唯一主分组,并针对带宽受限将客户端请求只先发送给主分组内的数据中心。系统能在更短的时间,更小的传输数据量下完成请求,提高系统的处理能力。同时,对数据实时性准确性要求高的数据中心优先同步,保证系统的可靠性。
本发明提出了基于Multi-Paxos分组的自适应一致性协议GroupingMulti-Paxos(GM-Paxos)来减少带宽对系统的影响并自适应地选择一致性级别。结合DC的特性和系统环境,本发明设计了一个分组算法来寻找主分组,并且首先只将请求内容发送到主分组内的DC(Data Center,数据中心)以节省带宽消耗。实验表明,GM-Paxos可以显着减少延迟并提高吞吐量。此外,本发明优先同步具有高实时数据要求的DC,以确保系统的可靠性。
本发明提供了一种基于Multi-Paxos分组的自适应一致性协议优化方法,具有以下优点:
1.提出了一种基于Multi-paxos分组的自适应一致性协议GM-Paxos,根据数据中心副本一致性程度、相关性程度和传输平均时延三个指标动态规划主分组,通过构建优化函数设计分组算法求解出唯一最佳主分组,实现自适应一致性。
2.基于带宽受限问题,本发明优化改进了Multi-Paxos协议,将客户端请求由原先的发送到全部数据中心改为只发送到主分组内的数据中心。
3.实验证明,在带宽受限的情况下,GM-Paxos相比于传统的Multi-Paxos协议时延大幅度降低,且请求执行完成时传输的数据量减少,吞吐量得到提高,系统的处理能力得到提升。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (2)

1.一种基于Multi-Paxos分组的自适应一致性协议优化方法,其特征在于:将数据中心划分为主分组和辅助分组,当客户端发送一个请求到一个数据中心时,只先将客户端的请求内容发送给主分组的数据中心,在主分组的数据中心完成同步后认为请求执行完成,再在带宽空闲期,将请求内容发送给辅助分组的数据中心,根据数据中心副本一致性程度、相关性程度和传输平均时延三个指标动态规划主分组,通过构建优化函数设计分组算法求解出唯一最佳主分组,实现自适应一致性,数据中心副本一致性程度、相关性程度和传输平均时延三个指标具体定义如下:
定义1:假设单个数据中心到其他数据中心的传输时延分别为t1、t2、……tn-1、,定义单个数据中心的平均时延t为该数据中心到其他数据中心传输时延总和与总数据中心个数N的比值;
Figure FDA0003162236020000011
传输时延越小,系统响应时间越短,可用性越好;
定义2:定义单个数据中心的一致性程度s为已处理的请求数Qcomplete与客户端总请求数Qsum的比值;
Figure FDA0003162236020000012
一致性程度高则该数据中心未实现同步的请求较少,新的请求能较快的得到执行;
定义3:定义单个数据中心的相关性程度r为一段时间内访问该数据中心的访问量VDB与总访问量Vsum的比值;
Figure FDA0003162236020000013
相关性程度高,则系统的可靠性高;
每一个数据中心均有数据中心副本一致性程度、相关性程度和传输平均时延三个指标,基于这三个指标得到效率指标,效率指标定义如下:
定义4:定义单个数据中心的分组效率指标e为本数据中心的相关性程度和传输时延与等待时延的比值;
Figure FDA0003162236020000014
其中,β为系统参数,用效率指标评判数据中心成为主分组的优先程度及该数据中心在集群里所占的权重,即决策权的大小;
定义主分组中数据中心的效率指标总和必须大于所有数据中心总和的一半,以确保同时没有两个主分组,要求主分组的数量不超过所有数据中心数量的一半,可以减少请求的响应时间,由于数据中心的效率指标不同,因此,可以保证即使主分组的数量小于所有数据中心的数量的一半,效率指标的总和仍然可以超过所有数据中心的总和的一半,并且可以保证主分组的唯一性;
根据上述要求,得到多个符合条件的集合,因此,构建一个优化目标函数,通过权衡效率指标和主要群体的数量,找到满足高效率指标的最佳主分组,并且主分组的数量要尽可能小,优化目标函数如下。
Figure FDA0003162236020000021
s.t.e·j≥E’
Figure FDA0003162236020000022
这里,e是各数据中心效率指标e组成的向量,表示为:
e=[e1,e2,…eN]
j是反映各数据中心是否属于主分组的向量,表示为:
j=[j1,j2,…jN],其中ji∈[0,1],i=0,1,…N,
其中1表示该数据中心处于主分组内,0表示该数据中心处于主分组外;Pc是指系统中该请求已完成同步的数据中心与全部数据中心的百分比,表示为:
Figure FDA0003162236020000023
其中,∝为系统参数,E’是约束条件,代表全部数据中心效率指标总和的一半,选择的主分组必须满足超过此阈值才能代表多数派,保证两个分组的最终一致;E’具体表现形式:
Figure FDA0003162236020000024
将e·j-Pc定义为效率函数F,通过找到满足约束条件的向量中,满足效率函数F最大的向量j作为主分组。
2.根据权利要求1所述的基于Multi-Paxos分组的自适应一致性协议优化方法,其特征在于:所述分组算法包括:当客户端向系统提出请求时,首先求出系统中各数据中心的效率指标ei,得到向量e和阈值E’,通过遍历所有的j可能存在的形式,找到满足能代表多数派前提下实现效率函数F最高的j向量,从该j向量就可得知具体主分组由哪些数据中心组成。
CN201910408554.8A 2019-05-16 2019-05-16 基于Multi-Paxos分组的自适应一致性协议优化方法 Active CN110138863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910408554.8A CN110138863B (zh) 2019-05-16 2019-05-16 基于Multi-Paxos分组的自适应一致性协议优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910408554.8A CN110138863B (zh) 2019-05-16 2019-05-16 基于Multi-Paxos分组的自适应一致性协议优化方法

Publications (2)

Publication Number Publication Date
CN110138863A CN110138863A (zh) 2019-08-16
CN110138863B true CN110138863B (zh) 2021-11-02

Family

ID=67574614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910408554.8A Active CN110138863B (zh) 2019-05-16 2019-05-16 基于Multi-Paxos分组的自适应一致性协议优化方法

Country Status (1)

Country Link
CN (1) CN110138863B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112202687B (zh) * 2020-12-03 2021-05-25 苏州浪潮智能科技有限公司 一种节点同步方法、装置、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080071878A1 (en) * 2006-09-18 2008-03-20 Reuter James M Method and system for strong-leader election in a distributed computer system
GB2484086A (en) * 2010-09-28 2012-04-04 Metaswitch Networks Ltd Reliability and performance modes in a distributed storage system
US20150113314A1 (en) * 2013-07-11 2015-04-23 Brian J. Bulkowski Method and system of implementing a distributed database with peripheral component interconnect express switch
CN103530317B (zh) * 2013-09-12 2017-07-07 杭州电子科技大学 云存储系统中一种能耗自适应的副本管理方法
CN106375416B (zh) * 2016-08-30 2019-08-09 北京航空航天大学 分布式数据存储系统中一致性动态调整方法及装置
US10447805B2 (en) * 2016-10-10 2019-10-15 Cisco Technology, Inc. Distributed consensus in a content centric network
CN106603645A (zh) * 2016-12-02 2017-04-26 广东电网有限责任公司电力科学研究院 一种大规模云存储的副本服务器一致性处理方法及系统
CN108170763B (zh) * 2017-12-25 2021-07-27 江南大学 一种低延迟的分布式计算共识算法
CN108234630B (zh) * 2017-12-29 2021-03-23 北京奇虎科技有限公司 基于分布式一致性协议实现的数据读取方法及装置
CN108462737B (zh) * 2018-01-29 2021-02-02 哈尔滨工业大学深圳研究生院 基于批处理和流水线的分层数据一致性协议优化方法
CN108833531A (zh) * 2018-06-12 2018-11-16 合肥工业大学 一种基于数据中心能耗和网络能耗的数据放置方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Hierarchical Framework with Consistency Trade-off Strategies for Big Data Management;Yingyi Yang;《IEEE》;20170818;全文 *

Also Published As

Publication number Publication date
CN110138863A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN111124662B (zh) 一种雾计算负载均衡方法及系统
CN102624922B (zh) 一种网络gis异构集群服务器负载均衡方法
CN111027736A (zh) 多目标优化下的微服务组合部署与调度方法
CN112118312B (zh) 一种面向边缘服务器的网络突发负载疏散方法
CN112737823A (zh) 一种资源切片分配方法、装置及计算机设备
CN111538570B (zh) 一种面向节能和QoS保障的VNF部署方法及装置
CN111258980B (zh) 一种云存储系统中基于组合预测的动态文件放置方法
CN111813330A (zh) 用于分派输入-输出的系统及方法
Wen et al. Load balancing job assignment for cluster-based cloud computing
Li et al. Scalable and dynamic replica consistency maintenance for edge-cloud system
CN115629865A (zh) 一种基于边缘计算的深度学习推理任务调度方法
CN110138863B (zh) 基于Multi-Paxos分组的自适应一致性协议优化方法
CN109951317B (zh) 一种基于用户驱动的流行度感知模型的缓存替换方法
CN111324429A (zh) 一种基于多代血统参考距离的微服务组合调度方法
Lu et al. Geographic information and node selfish-based routing algorithm for delay tolerant networks
Xavier et al. Managing heterogeneous and time-sensitive IoT applications through collaborative and energy-Aware resource allocation
CN109600432B (zh) 内容中心移动边缘网络用户动态接入方法
Gu et al. Grouping-based consistency protocol design for end-edge-cloud hierarchical storage system
Yan et al. Service caching for meteorological emergency decision-making in cloud-edge computing
CN109254844A (zh) 一种大规模图的三角形计算方法
Wen et al. Load balancing consideration of both transmission and process responding time for multi-task assignment
Fu et al. Data replica placement policy based on load balance in cloud storage system
CN109450809B (zh) 一种数据中心调度系统及方法
Wang et al. Adaptive consistency protocol based on grouping multi-paxos
CN114490018A (zh) 一种基于资源特征匹配的服务调度算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant