CN110213351A - 一种面向广域高性能计算环境的动态自适应io负载均衡方法 - Google Patents

一种面向广域高性能计算环境的动态自适应io负载均衡方法 Download PDF

Info

Publication number
CN110213351A
CN110213351A CN201910414396.7A CN201910414396A CN110213351A CN 110213351 A CN110213351 A CN 110213351A CN 201910414396 A CN201910414396 A CN 201910414396A CN 110213351 A CN110213351 A CN 110213351A
Authority
CN
China
Prior art keywords
load
service node
node
service
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910414396.7A
Other languages
English (en)
Inventor
肖利民
周汉杰
韦冰
秦广军
霍志胜
宋尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201910414396.7A priority Critical patent/CN110213351A/zh
Publication of CN110213351A publication Critical patent/CN110213351A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1012Server selection for load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1038Load balancing arrangements to avoid a single path through a load balancer

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提出一种面向广域高性能计算环境的动态自适应IO负载均衡方法,适用于广域高性能计算环境的CS架构中,运行于文件访问服务节点之上,其特征在于每个文件访问服务节点自适应调整负载收集阈值,当服务节点的负载超过设定的阈值时,自动收集当前数据中心内其他服务节点的负载信息,并根据负载信息进行自主负载决策,自主选择最优迁移目标服务节点,利用并行负载迁移加速服务节点间的负载均衡,高负载服务节点告知客户端重定向到负载低的服务节点进行远程数据访问,低负载节点预取数据以减少数据访问的时延,本发明具有良好的稳定性和可扩展性,能根据实际运行状况自适应的动态调整负载,聚合多服务节点带宽,提升远程文件数据访问性能。

Description

一种面向广域高性能计算环境的动态自适应IO负载均衡方法
技术领域:
本发明公开了一种面向广域高性能计算环境的动态自适应IO负载均衡方法,涉及广域高性能计算面临的挑战,属于计算机技术领域。
背景技术:
在广域高性能计算环境中访问远程文件数据时,需通过客户端向远程文件访问服务节点发送数据请求并进行访问。文件访问服务节点负载均衡建立在网络结构之上,通过对大量远程数据的并发访问分流到多个服务节点上分别进行处理,为性能各异的服务节点分配合适数量的访问请求,聚合多服务节点带宽,提升远程文件数据访问性能。负载均衡算法已经被广泛应用于减少用户的响应等待时间,当前多数研究人员主要从静态负载均衡和动态负载均衡两个方面对负载均衡进行研究。
在静态负载均衡方面,系统在运行前就根据服务器当前信息进行负载分配,而不考虑运行过程中负载变化的影响。Thomas等人提出了一种随机选择算法,该算法首先构造随机函数,并在请求到来时利用随机函数生成随机数来选择服务器,该方法实现简单,在一定程度上均衡了多个服务器间的负载。Baumberger等人提出了一种加权轮询算法,该算法根据后端处理器的处理能力为其设置相应的权重,当请求到来时在轮询过程中根据权重为每个处理器分配相应数量的服务请求,有效均衡了不同性能处理器之间的负载。Li等人提出了一种基于一致性哈希的负载均衡算法,该算法在多个Web服务器间构造一致性哈希环,当请求到来时根据一致性哈希算法将请求映射到相应的Web服务器上,该方法有效减少了系统的平均响应时间,提升了系统的整体性能。C.Kim等人在异构环境下设计了基于最小平均相应时间的服务选择策略,该策略有效均衡了异构环境下多服务器间的负载。Lee等人提出了一种通过周期性监测服务器磁盘响应时间并选择具有最小响应时间的服务器为客户端服务IO请求,该方法以较小的开销实现了服务器磁盘的负载均衡,有效减少了客户端的IO响应时间。Gao等人提出了一种加权最小连接负载均衡算法,该算法为每个服务器计算连接数与处理性能的权重比,每次将具有请求发送给具有最小比值的服务器,该算法综合考虑了服务器的处理性能对连接数量的影响,有效均衡了服务器间的负载。尽管静态的负载均衡策略在一定程度能够均衡负载,但是面对密集型的IO负载、异构的软硬件环境、系统故障等情况时,不能根据实际运行状况自适应的动态调整负载,从而导致系统整体性能降低。
在动态负载均衡方面,系统在运行过程中根据服务器和访问请求的相关信息动态地进行负载分配。动态负载均衡技术可进一步分成基于集中式决策、基于分组决策、基于分布式决策等三类的负载均衡方法。
在基于集中式决策负载均衡方面,Scheuermann等人提出了一种基于启发式的集中式动态均衡算法,该算法根据应用的访问模式智能的对文件进行动态再分配,降低了服务器的平均IO响应时间,提升了文件数据的访问性能。Sun等人提出了一种基于神经网络预测的动态分配方法,该方法通过神经网络预测服务器磁盘的访问频率,并根据预测结果动态重分配负载,从而实现服务器间的负载均衡。Kunkel设计了一种基于文件动态迁移的自适应负载均衡方法,该方法采用集中式决策的负载均衡策略,采用负载迁移模型来决定文件迁移的目标服务器,有效均衡了集群的负载,提升了集群的整体性能。在服务器少、请求服务少、IO负载低的情况下集中式负载均衡方法能够取到很好的效果,但是随着服务器数量增多、密集型IO越来越多容易导致集中式决策服务器成为性能瓶颈。
在基于分组决策的负载均衡方面,Liu等人提出了一种面向Web机群的分组决策的负载均衡方法,该方法将多个Web服务器组织成组,并在组内选择一个节点负载该组的负载决策,有效减少了网络通信开销,提升了系统的性能。基于分组决策的负载均衡采用分而治之的方式获减少了网络带宽开销,具有更小的网络通信,对系统的性能影响小,但是该方法在每次均衡操作需要多次网络传输,即组内通信和组间通信,因此决策响应时间延迟大。
在基于分布式决策的负载均衡方面,Zhao等人提出了一种面向云环境虚拟机迁移的动态负载均衡方法,每个服务器自主的采集其他服务器的负载情况,并在当前节点负载过高时将负载迁移到负载较低的服务器,每一次负载迁移只需要一次网络开销通信来收集负载,因此有效减少了负载决策所需的开销。Belabbas等人提出了一种面向网格计算环境的分布式负载均衡方法,每个网格节点自主采集其他节点的负载并进行自主负载迁移决策,该方法具有较好的扩展性。基于分布式决策的负载均衡在每次动态迁移负载时只需要一次网络通信来收集负载因此能有效减少负载决策所需的开销,该方法采用完全分布式的决策架构避免了单点性能瓶颈,但是节点之间频繁相互通信会导致网络拥塞从而降低系统的整体性能。
传统的负载均衡算法存在的问题主要为:
静态负载均衡方法虽然实现简单、系统开销小,但由于其不能根据实际运行状况自适应的动态调整负载,导致负载均衡效果并不理想,动态负载均衡方法中,服务器数量、密集型IO增多,基于集中式决策的负载均衡容易导致性能瓶颈,基于分组决策的负载均衡每次均衡操作需要多次网络传输,决策延迟大,基于分布式决策的负载均衡收集负载信息频繁导致网络拥塞。因此研究支持自适应调整负载收集阈值、独立负载决策、自主选择负载迁移目标的分布式负载均衡方法。
发明内容:
本发明的主要目的是提供一种面向广域高性能计算环境的动态自适应IO负载均衡方法,针对负载收集造成的网络开销大,它实现了自适应调整负载收集阈值较少网络开销,并根据负载信息进行自主负载决策;针对负载迁移性能低,它实现了并行负载迁移加速服务节点间的负载均衡;针对负载迁移导致数据访问时延长,它实现了数据预取减少数据访问时延。
本发明的技术方案是:
一种面向广域高性能计算环境的动态自适应IO负载均衡方法,其特征在于,每个文件访问服务节点自适应调整负载收集阈值,当服务节点的负载超过设定的阈值时,自动收集当前数据中心内其他服务节点的负载信息,并根据负载信息进行自主负载决策,自主选择最优迁移目标服务节点,利用并行负载迁移加速服务节点间的负载均衡,高负载服务节点告知客户端重定向到负载低的服务节点进行远程数据访问,低负载节点预取数据以减少数据访问的时延,本发明具有良好的稳定性和可扩展性,能根据实际运行状况自适应的动态调整负载,聚合多服务节点带宽,提升远程文件数据访问性能。
所述方法包括以下步骤,具体如下:
1)每个服务节点在进行负载均衡决策前尽可能收集当前数据中心内所有服务节点的负载信息,为做出正确的负载均衡决策提供依据;
2)每个服务节点基于自身的负载和当前数据中心内其他服务节点的负载做出负载决策;
3)基于每个服务节点的负载状态选择最优目标迁移对象,并采用并行的负载迁移机制加速服务节点间的负载迁移;
4)基于服务节点负载状况将客户端的请求从负载高的服务节点重定向到负载低的服务节点,在重定向的过程中向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取。
其中,步骤1)包括以下步骤:
步骤(1.1)为每个服务节点设置一个负载收集阈值以减少服务节点间相互传递的负载信息量,选择平均响应时间等于设定阈值时的负载作为其负载收集阈值,记为Lt
步骤(1.2)当负载小于或等于Lt时,服务节点对IO请求的平均响应时间在可接受范围内,因此不需要向其他服务节点进行负载信息收集;
步骤(1.3)当负载大于Lt时,该服务节点会触发负载收集,并根据收集的负载信息进行负载均衡决策;
步骤(1.4)当所有的服务节点的负载都大于Lt时,采用自适应的阈值调整机制来动态调整每个服务节点的负载收集阈值,在所有的服务节点的负载都大于Lt时,以一定的比例增大每个服务节点的负载收集阈值,从而有效减少服务节点间的负载收集信息量。为了减少服务节点间负载收集的时间,服务节点并行地向其他服务节点发送负载信息请求,并以批量的形式收集负载,从而加速负载收集。
步骤2)包括以下步骤:
步骤(2.1)在做出负载决策时需兼顾自身的负载和当前数据中心内其他服务节点的负载,设服务节点的数量为n,第i(1≤i≤n)个服务节点的负载为Li,计算服务节点间的负载均衡效率,记为EL,是所有服务节点的平均负载与服务节点间最大负载之比;
步骤(2.2)设定合适的EL阈值,记为ELt,只有负载大于ELt的服务节点才能进行负载迁移,保证服务节点间的负载均衡同时不会引起负载的频繁迁移。
其中,步骤3)包括以下步骤:
步骤(3.1)赋予负载最高的服务节点最高的负载迁移优先级,负载最高的服务节点会选择负载最低的服务节点作为最优目标迁移对象,并告知当前服务节点服务的客户端重定向到目标服务节点上访问数据,从而实现负载的迁移;
步骤(3.2)负载第二高的服务节点具有次优先级选择目标迁移服务节点,其通常在没有迁移任务的服务节点中选择负载最低的服务节点作为最优目标迁移对象,以此类推;
步骤(3.3)若未找到匹配的目标迁移服务节点,则当前节点在此次均衡操作过程中不进行任何负载迁移;
步骤(3.4)并行迁移服务节点间的负载以加速服务节点间的负载均衡。
其中,步骤4)包括以下步骤:
步骤(4.1)目标服务节点确定后,当前服务节点告知客户端重定向到目标服务节点进行数据访问,并向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取;
步骤(4.2)当前服务节点与客户端断开连接,客户端重定向到目标服务节点并建立连接,在建立连接时存在一定的时间空隙,目标服务节点充分利用这一时间空隙对请求的数据进行预取,并将预取的数据存储到本地内存中;
步骤(4.3)当新的连接建立完成时,客户端从目标服务节点内存中快速访问数据而不需要访问底层的存储系统获取数据,从而实现数据的快速访问。
本发明的优点包括:
本发明所提出的一种面向广域高性能计算环境的动态自适应IO负载均衡方法,与现有技术相比,其主要优点是:
本论文所提出的服务节点负载均衡方法采用了采用完全分布式的负载均衡架构,具有良好的稳定性和可扩展性,没有单点瓶颈;每个服务节点自适应收集负载信息,并根据负载信息进行负载决策;服务节点自适应选择目标迁移服务节点,并进行并行负载迁移;对客户端请求进行重定向,避免高负载服务节点成为性能瓶颈,并采用数据预取机制提升远程文件数据的访问性能。
附图说明:
图1为一种面向广域高性能计算环境的动态自适应IO负载均衡方法实施流程图。
图2为广域文件系统架构图。
图3为文件访问服务节点间负载均衡流程图。
具体实施方式:
以下结合附图对本发明作进一步详细的说明。
一种面向广域高性能计算环境的动态自适应IO负载均衡方法,适用于广域高性能计算环境的CS架构中,运行于文件访问服务节点之上,其特征在于,每个文件访问服务节点自适应调整负载收集阈值,当服务节点的负载超过设定的阈值时,自动收集当前数据中心内其他服务节点的负载信息,并根据负载信息进行自主负载决策,自主选择最优迁移目标服务节点,利用并行负载迁移加速服务节点间的负载均衡,高负载服务节点告知客户端重定向到负载低的服务节点进行远程数据访问,低负载节点预取数据以减少数据访问的时延,本发明具有良好的稳定性和可扩展性,能根据实际运行状况自适应的动态调整负载,聚合多服务节点带宽,提升远程文件数据访问性能。
如图1所示,是本发明的方法实施流程图。包括以下步骤:
1)每个服务节点在进行负载均衡决策前尽可能收集当前数据中心内所有服务节点的负载信息,为做出正确的负载均衡决策提供依据;
2)每个服务节点基于自身的负载和当前数据中心内其他服务节点的负载做出负载决策;
3)基于每个服务节点的负载状态选择最优目标迁移对象,并采用并行的负载迁移机制加速服务节点间的负载迁移;
4)基于服务节点负载状况将客户端的请求从负载高的服务节点重定向到负载低的服务节点,在重定向的过冲中向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取。
广域文件系统架构如图2所示,客户机节点通过客户端访问远程文件,客户端首先通过管理节点中的空间管理模块获取全局元数据信息(包含用户的数据空间信息,例如空间名称、位置等),客户端将本地文件路径和数据空间信息拼接成实际的物理路径并发送到文件所在数据中心的文件访问服务节点,文件访问服务节点利用IO代理模块接收文件路径并调用存储集群客户端模块访问文件,并将文件数据返回。
文件访问服务节点间负载均衡流程如图3所示,在一个数据中心内的每个服务节点都会运行负载均衡算法,服务节点周期性监测自身负载,当自身的负载超过设定的阈值时则开始收集其他服务节点的负载信息,服务节点通过收集的负载信息进行负载决策,如果需要进行负载迁移则进行目标迁移服务节点选择,选择完成后告知客户端重定向到目标服务节点进行数据的访问,同时向目标服务节点发送数据预取命令,目标服务节点接收到数据预取命令后将客户端将要访问的数据预取并缓存到内存,当客户端与目标服务节点的连接建立完成后即可快速访问远程数据。负载收集方法、负载决策机制、目标迁移服务节点选择机制和数据预取机制的主要原理如下:
负载收集方法:每一个服务节点在进行负载均衡决策前需要尽可能收集当前数据中心内所有服务节点的负载信息,从而做出正确的负载均衡决策。然而频繁的负载信息收集可能会导致服务节点的性能下降,从而增大远程数据的访问时延。因此需为服务节点设置一个负载收集阈值以减少服务节点间相互传递的负载信息量。对于一个服务节点随着负载增大,其对IO请求的平均响应时间将会增大,对于单一服务节点,选择平均响应时间等于设定阈值时的负载作为其负载收集阈值(记为Lt)。当负载小于或等于Lt时,服务节点对IO请求的平均响应时间在可接受范围内,因此不需要向其他服务节点进行负载信息收集;当负载大于Lt时,服务节点对IO请求的平均响应时间过长,因此该服务节点会触发负载收集,并根据收集的负载信息进行负载均衡决策。通过设置负载收集阈值可以有效减少服务节点间的负载收集信息量,但是当所有的服务节点的负载都大于Lt时每个服务节点都会向其他服务节点收集负载信息,从而造成极大的负载收集通信量。为了解决这一问题,采用自适应的阈值调整机制来动态调整每个服务节点的负载收集阈值。自适应的阈值调整机制在所有的服务节点的负载都大于Lt时,以一定的比例增大每个服务节点的负载收集阈值,从而有效减少服务节点间的负载收集信息量。为了减少服务节点间负载收集的时间,服务节点并行地向其他服务节点发送负载信息请求,并以批量的形式收集负载,从而加速负载收集。
负载决策机制:每个服务节点能够独立的做出负载决策且在做出负载决策时需兼顾自身的负载和当前数据中心内其他服务节点的负载。设服务节点的数量为n,第i(1≤i≤n)个服务节点的负载为Li,则服务节点间的负载均衡效率(记为EL)是所有服务节点的平均负载与服务节点间最大负载之比,即EL的值位于0和1之间,将EL的值设定越靠近1则所有服务节点间的负载越均匀,但是会导致负载在不同的服务节点间进行迁移,而频繁的负载迁移会导致远程数据访问性能降低,因此需要设定合适的EL阈值(记为ELt),只有负载大于ELt的服务节点才能进行负载迁移,保证服务节点间的负载均衡同时不会引起负载的频繁迁移。
目标迁移服务节点选择机制:本论文采用并行的负载迁移机制以加速服务节点间的负载均衡。为了实现快速的负载均衡负载,赋予负载最高的服务节点最高的负载迁移优先级,负载最高的服务节点会选择负载最低的服务节点作为最优目标迁移对象,并告知当前服务节点上的客户端重定向到目标服务节点上访问数据,从而实现负载的迁移。负载第二高的服务节点具有次优先级选择目标迁移服务节点,其通常在没有迁移任务的服务节点中选择负载最低的服务节点作为最优目标迁移对象。以此类推。这一方法避免了多个做负载决策的服务节点同时选择最低负载的服务节点作为迁移对象从而导致目标服务节点成为新的负载热点,若未找到匹配的目标迁移服务节点,则当前节点在此次均衡操作过程中不进行任何负载迁移。
数据预取机制:目标服务节点确定后,当前服务节点告知客户端重定向到目标服务节点进行数据访问,并向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取。当前服务节点与客户端断开连接,客户端重定向到目标服务节点并建立连接,在建立连接时存在一定的时间空隙,目标服务节点充分利用这一时间空隙对请求的数据进行预取,并将预取的数据存储到本地内存中,当新的连接建立完成时,客户端从目标服务节点内存中快速访问数据而不需要访问底层的存储系统获取数据,从而实现数据的快速访问。
最后所应说明的是:本发明还可有其它多种应用场景,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明的保护范围。

Claims (6)

1.一种面向广域高性能计算环境的动态自适应IO负载均衡方法,其特征在于,每个文件访问服务节点自适应调整负载收集阈值,当服务节点的负载超过设定的阈值时,自动收集当前数据中心内其他服务节点的负载信息,并根据负载信息进行自主负载决策,自主选择最优迁移目标服务节点,利用并行负载迁移加速服务节点间的负载均衡,高负载服务节点告知客户端重定向到负载低的服务节点进行远程数据访问,低负载节点预取数据以减少数据访问的时延,本发明具有良好的稳定性和可扩展性,能根据实际运行状况自适应的动态调整负载,聚合多服务节点带宽,提升远程文件数据访问性能。
2.根据权利要求1所述的方法,其特征在于,所述方法包括以下步骤:
1)每个服务节点在进行负载均衡决策前尽可能收集当前数据中心内所有服务节点的负载信息,为做出正确的负载均衡决策提供依据;
2)每个服务节点基于自身的负载和当前数据中心内其他服务节点的负载做出负载决策;
3)基于每个服务节点的负载状态选择最优目标迁移对象,并采用并行的负载迁移机制加速服务节点间的负载迁移;
4)基于服务节点负载状况将客户端的请求从负载高的服务节点重定向到负载低的服务节点,在重定向的过程中向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取。
3.根据权利要求2所述的方法,其特征在于,所述步骤1)包括以下步骤:
步骤(1.1)为每个服务节点设置一个负载收集阈值以减少服务节点间相互传递的负载信息量,选择平均响应时间等于设定阈值时的负载作为其负载收集阈值,记为Lt
步骤(1.2)当负载小于或等于Lt时,服务节点对IO请求的平均响应时间在可接受范围内,因此不需要向其他服务节点进行负载信息收集;
步骤(1.3)当负载大于Lt时,该服务节点会触发负载收集,并根据收集的负载信息进行负载均衡决策;
步骤(1.4)当所有的服务节点的负载都大于Lt时,采用自适应的阈值调整机制来动态调整每个服务节点的负载收集阈值,在所有的服务节点的负载都大于Lt时,以一定的比例增大每个服务节点的负载收集阈值,从而有效减少服务节点间的负载收集信息量。为了减少服务节点间负载收集的时间,服务节点并行地向其他服务节点发送负载信息请求,并以批量的形式收集负载,从而加速负载收集。
4.根据权利要求2所述的方法,其特征在于,所述步骤2)包括以下步骤:
步骤(2.1)在做出负载决策时需兼顾自身的负载和当前数据中心内其他服务节点的负载,设服务节点的数量为n,第i(1≤i≤n)个服务节点的负载为Li,计算服务节点间的负载均衡效率,记为EL,是所有服务节点的平均负载与服务节点间最大负载之比;
步骤(2.2)设定合适的EL阈值,记为ELt,只有负载大于ELt的服务节点才能进行负载迁移,保证服务节点间的负载均衡同时不会引起负载的频繁迁移。
5.根据权利要求2所述的方法,其特征在于,所述步骤3)包括以下步骤:
步骤(3.1)赋予负载最高的服务节点最高的负载迁移优先级,负载最高的服务节点会选择负载最低的服务节点作为最优目标迁移对象,并告知当前服务节点服务的客户端重定向到目标服务节点上访问数据,从而实现负载的迁移;
步骤(3.2)负载第二高的服务节点具有次优先级选择目标迁移服务节点,其通常在没有迁移任务的服务节点中选择负载最低的服务节点作为最优目标迁移对象,以此类推;
步骤(3.3)若未找到匹配的目标迁移服务节点,则当前节点在此次均衡操作过程中不进行任何负载迁移;
步骤(3.4)并行迁移服务节点间的负载以加速服务节点间的负载均衡。
6.根据权利要求2所述的方法,其特征在于,所述步骤4)包括以下步骤:
步骤(4.1)目标服务节点确定后,当前服务节点告知客户端重定向到目标服务节点进行数据访问,并向目标服务节点发送数据预取请求,告知目标服务节点对客户端将要访问的数据进行预取;
步骤(4.2)当前服务节点与客户端断开连接,客户端重定向到目标服务节点并建立连接,在建立连接时存在一定的时间空隙,目标服务节点充分利用这一时间空隙对请求的数据进行预取,并将预取的数据存储到本地内存中;
步骤(4.3)当新的连接建立完成时,客户端从目标服务节点内存中快速访问数据而不需要访问底层的存储系统获取数据,从而实现数据的快速访问。
CN201910414396.7A 2019-05-17 2019-05-17 一种面向广域高性能计算环境的动态自适应io负载均衡方法 Pending CN110213351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910414396.7A CN110213351A (zh) 2019-05-17 2019-05-17 一种面向广域高性能计算环境的动态自适应io负载均衡方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910414396.7A CN110213351A (zh) 2019-05-17 2019-05-17 一种面向广域高性能计算环境的动态自适应io负载均衡方法

Publications (1)

Publication Number Publication Date
CN110213351A true CN110213351A (zh) 2019-09-06

Family

ID=67787675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910414396.7A Pending CN110213351A (zh) 2019-05-17 2019-05-17 一种面向广域高性能计算环境的动态自适应io负载均衡方法

Country Status (1)

Country Link
CN (1) CN110213351A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111131505A (zh) * 2019-12-31 2020-05-08 深圳市网心科技有限公司 基于p2p网络的数据传输方法、设备、系统、装置及介质
CN111782627A (zh) * 2020-05-26 2020-10-16 北京航空航天大学 面向广域高性能计算环境的任务与数据协同调度方法
CN113098917A (zh) * 2019-12-23 2021-07-09 华为技术有限公司 迁移功能节点的方法和相关设备
CN113689103A (zh) * 2021-08-18 2021-11-23 国电南瑞南京控制系统有限公司 自适应负载均衡用采分流智能调度管理方法、装置及系统
CN114844912A (zh) * 2022-04-22 2022-08-02 北京志凌海纳科技有限公司 数据链路分配方法、装置及分布式块存储系统
CN117112239A (zh) * 2023-10-23 2023-11-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种异构推理后端上的可扩展负载均衡方法及系统
WO2024050848A1 (zh) * 2022-09-09 2024-03-14 北京小米移动软件有限公司 人工智能ai任务处理方法和装置
CN113098917B (zh) * 2019-12-23 2024-06-04 华为云计算技术有限公司 迁移功能节点的方法和相关设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664812A (zh) * 2012-05-14 2012-09-12 山东大学 融合业务预测与实时负载的两阶段服务系统负载预测与均衡方法
CN102707966A (zh) * 2012-04-12 2012-10-03 腾讯科技(深圳)有限公司 加速操作系统启动的方法及装置、预取信息生成方法及装置和终端
CN103188346A (zh) * 2013-03-05 2013-07-03 北京航空航天大学 支持分布式决策的大规模高并发访问i/o服务器负载均衡系统
CN103188345A (zh) * 2013-03-01 2013-07-03 北京邮电大学 分布式动态负载管理系统和方法
CN103546542A (zh) * 2013-09-29 2014-01-29 北京航空航天大学 服务器负载均衡方法和装置
CN104035887A (zh) * 2014-05-22 2014-09-10 中国科学院计算技术研究所 一种基于精简配置系统的块设备缓存装置及其方法
US20180054749A1 (en) * 2016-08-19 2018-02-22 Sprint Spectrum Lp Dynamic handover threshold adjustment for load balancing
CN109408227A (zh) * 2018-09-19 2019-03-01 平安科技(深圳)有限公司 负载均衡方法、装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102707966A (zh) * 2012-04-12 2012-10-03 腾讯科技(深圳)有限公司 加速操作系统启动的方法及装置、预取信息生成方法及装置和终端
CN102664812A (zh) * 2012-05-14 2012-09-12 山东大学 融合业务预测与实时负载的两阶段服务系统负载预测与均衡方法
CN103188345A (zh) * 2013-03-01 2013-07-03 北京邮电大学 分布式动态负载管理系统和方法
CN103188346A (zh) * 2013-03-05 2013-07-03 北京航空航天大学 支持分布式决策的大规模高并发访问i/o服务器负载均衡系统
CN103546542A (zh) * 2013-09-29 2014-01-29 北京航空航天大学 服务器负载均衡方法和装置
CN104035887A (zh) * 2014-05-22 2014-09-10 中国科学院计算技术研究所 一种基于精简配置系统的块设备缓存装置及其方法
US20180054749A1 (en) * 2016-08-19 2018-02-22 Sprint Spectrum Lp Dynamic handover threshold adjustment for load balancing
CN109408227A (zh) * 2018-09-19 2019-03-01 平安科技(深圳)有限公司 负载均衡方法、装置及存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113098917A (zh) * 2019-12-23 2021-07-09 华为技术有限公司 迁移功能节点的方法和相关设备
CN113098917B (zh) * 2019-12-23 2024-06-04 华为云计算技术有限公司 迁移功能节点的方法和相关设备
CN111131505A (zh) * 2019-12-31 2020-05-08 深圳市网心科技有限公司 基于p2p网络的数据传输方法、设备、系统、装置及介质
WO2021134928A1 (zh) * 2019-12-31 2021-07-08 深圳市网心科技有限公司 基于p2p网络的数据传输方法、设备、系统、装置及介质
CN111782627A (zh) * 2020-05-26 2020-10-16 北京航空航天大学 面向广域高性能计算环境的任务与数据协同调度方法
CN111782627B (zh) * 2020-05-26 2022-07-01 北京航空航天大学 面向广域高性能计算环境的任务与数据协同调度方法
CN113689103B (zh) * 2021-08-18 2023-11-24 国电南瑞南京控制系统有限公司 自适应负载均衡用采分流智能调度管理方法、装置及系统
CN113689103A (zh) * 2021-08-18 2021-11-23 国电南瑞南京控制系统有限公司 自适应负载均衡用采分流智能调度管理方法、装置及系统
CN114844912B (zh) * 2022-04-22 2022-12-09 北京志凌海纳科技有限公司 数据链路分配方法、装置及分布式块存储系统
CN114844912A (zh) * 2022-04-22 2022-08-02 北京志凌海纳科技有限公司 数据链路分配方法、装置及分布式块存储系统
WO2024050848A1 (zh) * 2022-09-09 2024-03-14 北京小米移动软件有限公司 人工智能ai任务处理方法和装置
CN117112239A (zh) * 2023-10-23 2023-11-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种异构推理后端上的可扩展负载均衡方法及系统
CN117112239B (zh) * 2023-10-23 2024-02-09 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种异构推理后端上的可扩展负载均衡方法及系统

Similar Documents

Publication Publication Date Title
CN110213351A (zh) 一种面向广域高性能计算环境的动态自适应io负载均衡方法
Fan et al. Towards workload balancing in fog computing empowered IoT
CN102724277B (zh) 虚拟机热迁移和部署的方法、服务器及集群系统
WO2016074323A1 (zh) 内容分发网络的http调度系统和方法
CN105491138B (zh) 一种基于负载率分级触发的分布式负载调度方法
CN107426332B (zh) 一种web服务器集群的负载均衡方法及系统
CN113110933B (zh) 一种具有Nginx负载均衡技术的系统
CN110933139A (zh) 一种解决Web服务器高并发的系统及方法
CN111338801B (zh) 一种实现元数据负载均衡的子树迁移方法、装置
CN110445866A (zh) 一种移动边缘计算环境中任务迁移和协作式负载均衡方法
CN108200156A (zh) 一种云环境下分布式文件系统的动态负载均衡方法
CN102480502B (zh) 一种i/o负载均衡方法及i/o服务器
CN106059940B (zh) 一种流量控制方法及装置
CN110597598B (zh) 一种云环境中的虚拟机迁移的控制方法
CN107197039B (zh) 一种基于cdn的paas平台服务包分发方法及系统
Vondra et al. QoS-ensuring distribution of computation load among cloud-enabled small cells
Mukhopadhyay et al. Migration-aware network services with edge computing
CN107566535A (zh) 一种Web地图服务中基于用户并发访问时序规则的自适应负载均衡策略
Qin et al. Research on nginx dynamic load balancing Algorithm
Ju et al. Collaborative in-network processing for internet of battery-less things
Mukhopadhyay et al. Learning automata for multi-access edge computing server allocation with minimal service migration
Akhavan et al. Deep reinforcement learning for online latency aware workload offloading in mobile edge computing
Ashalatha et al. Dynamic load balancing methods for resource optimization in cloud computing environment
CN116302404B (zh) 面向资源解耦合数据中心的服务器无感知计算调度方法
CN115190121B (zh) 基于跨地域的微服务过量负载调度系统、方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190906

RJ01 Rejection of invention patent application after publication