CN109274710A - 网络负载均衡方法、装置及集群服务系统 - Google Patents

网络负载均衡方法、装置及集群服务系统 Download PDF

Info

Publication number
CN109274710A
CN109274710A CN201810902938.0A CN201810902938A CN109274710A CN 109274710 A CN109274710 A CN 109274710A CN 201810902938 A CN201810902938 A CN 201810902938A CN 109274710 A CN109274710 A CN 109274710A
Authority
CN
China
Prior art keywords
node
health degree
real time
task requests
destination node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810902938.0A
Other languages
English (en)
Inventor
代俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Shenma Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shenma Mobile Information Technology Co Ltd filed Critical Guangzhou Shenma Mobile Information Technology Co Ltd
Priority to CN201810902938.0A priority Critical patent/CN109274710A/zh
Publication of CN109274710A publication Critical patent/CN109274710A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/101Server selection for load balancing based on network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/302Route determination based on requested QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

公开了一种网络负载均衡方法、装置及集群服务系统。在有待下发的任务请求时,获取集群服务系统中可用的节点的健康度信息;计算节点的下发概率和健康度等级;选择发送任务请求的第一目标节点和第二目标节点,第一目标节点为正常健康等级的节点,第二目标节点为不健康等级的节点;分别向第一目标节点和第二目标节点发送任务请求;接收并采纳第一目标节点反馈的任务请求的处理结果,并分别接收第一目标节点和第二目标节点在反馈任务请求的处理结果时发送的实时健康度参数,并根据实时健康度参数分别计算并存储相应目标节点的健康度信息。这样,当出现个别节点异常时也能避免引起网络系统处理效率低下,以及从而避免出现节点宕机。

Description

网络负载均衡方法、装置及集群服务系统
本发明专利申请是申请号为201510075547.2,申请日为2015年2月12日,发明名称为“网络负载均衡方法、装置及集群服务系统”的中国发明专利申请的分案申请。
技术领域
本发明涉及互联网技术领域,特别是涉及网络负载均衡方法、装置及集群服务系统。
背景技术
在互联网中,用户的网络请求是由集群服务系统(简称集群)执行的。随着网络技术的迅猛发展,用户通过网络获取信息的需求不断增多,集群的负载也不断增加。为了使集群内多个服务节点(简称searcher节点或节点)之间实现合理的任务分配以提高系统的处理效率,在互联网中引入了负载均衡技术。负载均衡技术一方面把大量的并发任务请求或数据流量分担到多个节点上分别处理,减少流量拥塞,另一方面将单个任务请求分担到多个节点上做并行处理,提高系统的响应速度。
传统的网络负载均衡技术主要采用轮询调度算法和Hashing(哈希)算法。轮询调度算法每一次把来自用户的任务请求轮流分配给集群中的节点。Hashing算法则根据任务请求的源地址及目标IP地址,计算出对应的Hash值,并将任务请求分配给与该Hash值对应的节点。轮询调度算法和Hashing算法不关心每个节点的当前负载数和节点的处理能力,而是假设所有节点的处理能力都相同,其本质是将任务较为平均的分配到各节点中的负载均衡算法。
然而,当集群中的某个节点出现异常,例如该节点的I/O异常,或者由于网络暂时波动造成该节点负载过高时,从上层节点发过来的任务的处理能力就会降低。但是现有的负载均衡算法并没有对该节点做特别处理,而是依然会往该节点发送新的任务请求,这就导致该节点的任务队列增长迅速,如果该节点不能快速处理掉这些队列里面的任务,就会造成后续的任务请求都会超时,从而引起网络系统处理效率底下,甚至可能有节点宕机的风险。
发明内容
本发明实施例提供了网络负载均衡方法、装置及集群服务系统,以解决现有技术中的网络负载均衡方法当出现个别节点异常时容易引起网络系统处理效率低下,以及容易出现节点宕机风险的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
一方面,提供了一种网络负载均衡方法,所述方法包括:在有待下发的任务请求时,获取预先存储的集群服务系统中可用的节点的健康度信息;根据所述节点的健康度信息计算所述节点的下发概率和健康度等级,根据所述下发概率和所述健康度等级选择发送任务请求的第一目标节点和第二目标节点;所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点;分别向所述第一目标节点和第二目标节点发送所述任务请求;接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息。
可选的,所述方法还包括:根据预定周期内集群服务系统中各个节点返回的心跳信息设置各个节点的屏蔽状态,其中,所述可用的节点指屏蔽状态为未被屏蔽的节点。
可选的,所述健康度等级包括以下至少一项:不可服务、可以抛弃、正常服务、负载很低。
可选的,所述目标节点的实时健康度参数包括:
所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或所述目标节点处理所述任务请求的延时tprocess,和/或所述任务请求到达所述目标节点的网络延时tnet,和/或所述目标节点的I/O等待延时tio/wait
可选的,根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息,包括:根据所述第一目标节点的实时健康度参数加权计算得到所述第一目标节点的实时健康度信息;根据所述第二目标节点的实时健康度参数加权计算得到所述第二目标节点的实时健康度信息。
可选的,所述根据所述目标节点的实时健康度参数加权计算得到所述目标节点的实时健康度信息采用如下公式:
其中,H为目标节点的实时健康度信息,T(x)和TH(x)为预设归一化函数,α,β,χ,δ为取值为0到1之间的预设加权系数。
可选的,根据所述节点的健康度信息计算所述节点的下发概率采用如下公式:
其中,Pi为节点i的下发概率,W为可用节点的数量,为根据所述节点i的实时健康度在预设周期T内计算得到的所述节点i的平均健康度。
可选的,以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度包括:
根据存储的所述节点i的实时健康度确定对应的实时健康度等级;
根据所述实时健康度等级确定对应的实时加权系数;
以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
另一方面,提供了一种网络负载均衡装置,所述装置包括:获取单元,用于在有待下发的任务请求时,获取预先存储的集群服务系统中可用的节点的健康度信息;第一计算单元,用于根据所述节点的健康度信息计算所述节点的下发概率和健康度等级;选择单元,用于根据所述下发概率和健康度等级选择发送任务请求的第一目标节点和第二目标节点,所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点;发送单元,用于分别向所述第一目标节点和第二目标节点发送所述任务请求;接收单元,用于接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息。
可选的,所述目标节点的实时健康度参数包括:所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或所述目标节点处理所述任务请求的延时tprocess,和/或所述任务请求到达所述目标节点的网络延时tnet,和/或所述目标节点的I/O等待延时tio/wait
可选的,所述接收单元包括:第一计算子单元,用于根据所述第一目标节点的实时健康度参数加权计算得到所述第一目标节点的实时健康度信息,及根据所述第二目标节点的实时健康度参数加权计算得到所述第二目标节点的实时健康度信息。
可选的,所述第一计算子单元用于根据如下公式计算所述目标节点的实时健康度信息:
其中,H为目标节点的实时健康度信息,T(x)和TH(x)为预设归一化函数,α,β,χ,δ为取值为0到1之间的预设加权系数。
可选的,所述第一计算单元用于根据如下公式计算所述节点i的下发概率Pi
其中,W为可用节点的数量,为根据所述节点i的实时健康度在预设周期T内计算得到的所述节点i的平均健康度。
可选的,所述装置还包括:第二计算单元,用于以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度所述计算单元包括:
第二确定子单元,用于根据存储的所述节点i的实时健康度确定对应的实时健康度等级;
第三确定子单元,用于根据所述实时健康度等级确定对应的实时加权系数;
第二计算子单元,用于以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
另一方面,提供了一种集群服务系统,包括网络负载均衡装置和服务节点,所述网络负载均衡装置用于在有待下发的任务请求时,获取预先存储的集群服务系统中可用的节点的健康度信息,并根据所述服务节点的健康度信息计算所述节点的下发概率和健康度等级,并根据所述下发概率和所述健康度等级选择发送任务请求的第一目标节点和第二目标节点,以及分别向所述第一目标节点和第二目标节点发送所述任务请求,接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息;其中,所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点。
可选的,所述目标节点的实时健康度参数包括:所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或所述目标节点处理所述任务请求的延时tprocess,和/或所述任务请求到达所述目标节点的网络延时tnet,和/或所述目标节点的I/O等待延时tio/wait
上述本发明提供的网络负载均衡方法、装置及集群服务系统的技术方案,通过获取节点的健康度信息计算对应节点的下发概率,从而使路由节点router选择下发任务的目标节点时能够根据节点的健康度信息进行合理选择,避免选择健康度达不到指标的异常节点,提高系统的稳定性。并且,节点的健康度信息能得到实时计算和更新,从而使异常的节点自动恢复功能后即时加入到正常健康等级的节点中来,从而提高了集群服务系统的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明网络负载均衡方法提供的一个实施例的流程示意图。
图2为本发明网络负载均衡方法提供的另一个实施例的流程示意图。
图3为本发明网络负载均衡装置提供的一个实施例的结构示意图。
图4为本发明网络负载均衡装置提供的另一个实施例的结构示意图。
图5为本发明集群服务系统提供的一个实施例的结构示意图。
具体实施方式
首先对本发明网络负载均衡方法的第一个实施例进行说明,参见图1,为本发明网络负载均衡方法提供的一个实施例的流程示意图,本实施例包括如下步骤:
步骤101:获取集群服务系统中可用的节点的健康度信息。
在集群服务系统中,任务请求通常是逐级下发的,在每一级都有数量众多的节点可供选择下发任务请求。为描述方便,仅以单级任务请求的下发为例介绍本发明的实施例。在下发任务请求时,可以是上一级节点向下一级节点下发任务,也可以是专门设置的该级的路由节点(简称router节点或router)向服务节点(简称searcher节点或节点)下发任务,这里统称为router向节点下发任务。
router根据各节点的状态,排除不可用的节点,获得若干可用节点的健康度信息。这里,“不可用”的节点即被router暂时屏蔽的节点。若在预设的时间内某一节点的健康度信息达不到预设的指标,或该节点在预定周期内未返回心跳信息,或返回的心跳信息中包含的该节点的指标不达标,则在接下来的一段时间内,将该节点暂时屏蔽,即router下发任务请求时不会考虑该节点,直至再次收到来自该节点指标正常的心跳信息,或收到该节点指标正常的健康度信息,才会解除屏蔽。
步骤102:根据所述节点的健康度信息计算所述节点的下发概率,根据所述下发概率选择发送任务请求的对应目标节点。
router根据各节点的健康度信息计算对应节点的下发概率,如果健康度信息指示该节点的健康程度较高,则选择该节点作为下发任务请求的概率必然也较高。
步骤103:根据选择的所述目标节点发送所述任务请求。
本实施例提供的技术方案,通过获取节点的健康度信息计算对应节点的下发概率,从而使router选择下发任务请求的目标节点时能够根据节点的健康度信息进行合理选择,避免选择健康度达不到指标的异常节点,以及使异常节点有机会快速恢复其功能,提高系统的稳定性。
在本发明的其他实施例中,在步骤102中,根据所述下发概率选择发送任务请求的对应目标节点,具体可以包括:
步骤1021:根据所述节点的健康度信息确定所述节点对应的健康度等级。
例如,可以根据节点的健康度信息将节点分为不可服务、可以抛弃、正常服务、负载很低四个健康度等级。
步骤1022:根据所述下发概率从所述健康度等级满足预设等级条件的节点中选择所述对应目标节点。
通过将节点划分健康度等级,可以快速直观反映当前节点的健康度状况,在选择目标节点时,先根据节点的健康度等级排除不满足预设等级条件的节点,再根据下发概率选择满足等级条件的节点。
如图2所示,为本发明网络负载均衡方法提供的另一个实施例的流程示意图,本实施例包括如下步骤:
步骤201:获取集群服务系统中可用的节点的健康度信息。
步骤202:根据所述节点的健康度信息计算所述节点的下发概率,根据所述下发概率选择发送任务请求的对应目标节点。
步骤203:根据选择的所述目标节点发送所述任务请求。
步骤201至步骤203分别与前述实施例中步骤101至103对应,相关之处可参见前述实施例的相关描述。
可选的,所述目标节点包括第一目标节点和第二目标节点,其中所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点。
步骤204:计算并存储所述目标节点的实时健康度信息。
具体的,所述步骤204可以包括如下子步骤2041和2042(图中未示出):
步骤2041:接收所述目标节点在反馈所述任务请求的处理结果时发送的所述目标节点的实时健康度参数。
当所述目标节点中既包含正常健康等级的节点,也包含不健康等级的节点时,router采纳第一目标节点反馈的任务处理结果,对第二目标节点反馈的任务处理结果忽略,并接收目标节点在反馈任务处理结果的同时附带返回的实时健康度参数,以及根据所述实时健康度参数计算所述目标节点的实时健康度信息,从而可以更新健康等级和不健康等级的节点的实时健康度信息,尤其是更新不健康等级的节点的实时健康度信息,可以对不健康节点进行实时重点监控。
具体的,所述目标节点的实时健康度参数可以包括:
所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或
所述目标节点处理所述任务请求的延时tprocess,和/或
所述任务请求到达所述目标节点的网络延时tnet,和/或
所述目标节点的I/O等待延时tio/wait
步骤2042:根据所述目标节点的实时健康度参数加权计算得到所述目标节点的实时健康度信息。例如,根据所述第一目标节点的实时健康度参数加权计算得到第一目标节点的实时健康度信息,根据所述第二目标节点的实时健康度参数加权计算得到所述第二目标节点的实时健康度信息。
可选的,所述目标节点的实时健康度信息可以具体为目标节点的实时健康度H。在计算时,router可将实时健康度参数分别归一化到0-1之间,然后再进行加权计算。
具体可根据如下公式加权计算得到所述目标节点的实时健康度H:
其中,α,β,χ,δ为取值为0到1之间的预设加权系数。T(·)和TH(·)为归一化函数,在实际使用时,可以根据时间区间进行离散定义,例如:
TH(·)函数可采用与T(·)函数相同或类似的定义方式,其参数tio/wait可具体从所述目标节点的I/O延时tio和所述任务请求在所述目标节点中的等待延时twait中的一个较大值作为参数,即
tio/max=max(tio,twait)
由上述计算可知,归一化计算后节点的实时健康度H的取值范围为0-1,取值越大,代表该节点越健康。
具体的,可依据节点的实时健康度的值由高到低划分得到若干个实时健康度等级,例如不可服务、可以抛弃、正常服务、负载很低四个实时健康度等级。
在本发明的其他实施例中,根据所述节点的健康度信息计算所述节点i的下发概率Pi具体采用如下公式:
其中,W为可用节点的数量,为根据所述节点i的实时健康度H在预设周期T内计算得到的所述节点i的平均健康度。
可选的,可以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度计算方法为:
根据存储的所述节点i的实时健康度H确定对应的实时健康度等级;
根据所述实时健康度等级确定对应的实时加权系数;
以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
router根据计算得到的平均健康度,再确定该节点的平均健康度等级,并在内存中进行更新。对于新加入的节点,则将其平均健康度和平均健康度等级初始化为预定值。
本实施例提供的技术方案,通过获取节点的健康度信息计算对应节点的下发概率,从而使router选择下发任务请求的目标节点时能够根据节点的健康度信息进行合理选择,避免选择健康度达不到指标的异常节点,提高系统的稳定性。并且,系统的健康度信息能得到实时计算和更新,从而使异常的节点自动恢复功能后即时加入到正常健康等级的节点中来,提高系统效率。
与网络负载均衡方法提供的实施例相对应,本发明还提供了网络负载均衡装置的实施例。
如图3所示为网络负载均衡装置提供的一个实施例的结构示意图,所述装置包括:
获取单元301、第一计算单元302、选择单元303、发送单元304。
其中,所述获取单元301,用于获取集群服务系统中可用的节点的健康度信息;
所述第一计算单元302,用于根据所述节点的健康度信息计算所述节点的下发概率;
所述选择单元303,用于根据所述下发概率选择发送任务请求的对应目标节点;
所述发送单元304,用于根据选择的所述目标节点发送所述任务请求。
可选的,所述选择单元303包括(图中未示出):第一确定子单元3031,用于根据所述节点的健康度信息确定所述节点对应的健康度等级;第一选择子单元3032,用于根据所述下发概率从所述健康度等级满足预设等级条件的节点中选择所述对应目标节点。
图4为本发明网络负载均衡装置提供的另一个实施例的结构示意图,所述装置还包括:计算存储单元305,用于计算并存储所述目标节点的实时健康度信息。
可选的,所述计算存储单元305包括:接收子单元3051,用于接收所述目标节点在反馈所述任务请求的处理结果时发送的所述目标节点的实时健康度参数,所述目标节点包括第一目标节点和第二目标节点,其中所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点;第一计算子单元3052,用于根据所述目标节点的实时健康度参数加权计算得到所述目标节点的实时健康度信息。
可选的,所述目标节点的实时健康度参数包括:所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或所述目标节点处理所述任务请求的延时tprocess,和/或所述任务请求到达所述目标节点的网络延时tnet,和/或所述目标节点的I/O等待延时tio/wait
可选的,所述第一计算子单元3052,用于根据如下公式计算所述目标节点的实时健康度信息H:
其中,T(·)和TH(·)为归一化函数,α,β,χ,δ为取值为0到1之间的预设加权系数。
可选的,所述第一计算单元302用于根据如下公式计算所述节点i的下发概率Pi
其中,W为可用节点的数量,为根据所述节点i的实时健康度在预设周期T内计算得到的所述节点i的平均健康度。
可选的,所述装置还包括:第二计算单元(图中未示出),用于以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度
可选的,所述第二计算单元包括:第二确定子单元,用于根据存储的所述节点i的实时健康度确定对应的实时健康度等级;第三确定子单元,用于根据所述实时健康度等级确定对应的实时加权系数;第二计算子单元,用于以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
本发明提供的网络负载均衡装置的实施例,技术方案本质与上述网络负载均衡方法的实施例相同,因此未做具体解释描述,相关之处可参见上述网络负载均衡方法的实施例的对应部分。
本实施例提供的网络负载均衡装置的技术方案,通过获取节点的健康度信息计算对应节点的下发概率,从而使router选择下发任务请求的目标节点时能够根据节点的健康度信息进行合理选择,避免选择健康度达不到指标的异常节点,以及使异常的节点有机会快速恢复其功能,提高系统的稳定性。
另一方面,提供了一种集群服务系统,如图5所示,所述集群服务系统包括网络负载均衡装置和服务节点,所述网络负载均衡装置用于获取集群服务系统中可用的节点的健康度信息,并根据所述服务节点的健康度信息计算所述节点的下发概率,并根据所述下发概率选择发送任务请求的对应目标节点,以及根据选择的所述目标节点发送所述任务请求。
所述集群服务系统中的网络负载均衡装置,所采用的技术方案本质与上述网络负载均衡方法的实施例相同,因此未做具体解释描述,相关之处可参见上述网络负载均衡方法的实施例的对应部分。
本实施例提供的集群服务系统的技术方案,通过获取节点的健康度信息计算对应节点的下发概率,从而使router选择下发任务请求的目标节点时能够根据节点的健康度信息进行合理选择,避免选择健康度达不到指标的异常节点,以及使异常的节点有机会快速恢复其功能,系统的稳定性较高。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件的方式来实现,通用硬件包括通用集成电路、通用CPU、通用存储器、通用元器件等,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置及系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种网络负载均衡方法,其特征在于,所述方法包括:
在有待下发的任务请求时,获取预先存储的集群服务系统中可用的节点的健康度信息;
根据所述节点的健康度信息计算所述节点的下发概率和健康度等级;
根据所述下发概率和所述健康度等级选择发送任务请求的第一目标节点和第二目标节点,所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点;
分别向所述第一目标节点和第二目标节点发送所述任务请求;
接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预定周期内集群服务系统中各个节点返回的心跳信息设置各个节点的屏蔽状态,其中,所述可用的节点指屏蔽状态为未被屏蔽的节点。
3.根据权利要求1所述的方法,其特征在于,所述健康度等级包括以下至少一项:不可服务、可以抛弃、正常服务、负载很低。
4.根据权利要求1所述的方法,其特征在于,所述目标节点的实时健康度参数包括:
所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或
所述目标节点处理所述任务请求的延时tprocess,和/或
所述任务请求到达所述目标节点的网络延时tnet,和/或
所述目标节点的I/O等待延时tio/wait
5.根据权利要求1所述的方法,其特征在于,根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息,包括:
根据所述第一目标节点的实时健康度参数加权计算得到所述第一目标节点的实时健康度信息;
根据所述第二目标节点的实时健康度参数加权计算得到所述第二目标节点的实时健康度信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标节点的实时健康度参数加权计算得到所述目标节点的实时健康度信息采用如下公式:
其中,H为目标节点的实时健康度信息,T(x)和TH(x)为预设归一化函数,α,β,χ,δ为取值为0到1之间的预设加权系数。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,根据所述节点的健康度信息计算所述节点的下发概率采用如下公式:
其中,Pi为节点i的下发概率,W为可用节点的数量,为根据所述节点i的实时健康度在预设周期T内计算得到的所述节点i的平均健康度。
8.根据权利要求7所述的方法,其特征在于,还包括:以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度包括:
根据存储的所述节点i的实时健康度确定对应的实时健康度等级;
根据所述实时健康度等级确定对应的实时加权系数;
以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
9.一种网络负载均衡装置,其特征在于,所述装置包括:
获取单元,用于在有待下发的任务请求时,获取预先存储的集群服务系统中可用的节点的健康度信息;
第一计算单元,用于根据所述节点的健康度信息计算所述节点的下发概率和健康度等级;
选择单元,用于根据所述下发概率和所述健康度等级选择发送任务请求的第一目标节点和第二目标节点;所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点;
发送单元,用于分别向所述第一目标节点和第二目标节点发送所述任务请求;
接收单元,用于接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息。
10.根据权利要求9所述的装置,其特征在于,所述目标节点的实时健康度参数包括:
所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或
所述目标节点处理所述任务请求的延时tprocess,和/或
所述任务请求到达所述目标节点的网络延时tnet,和/或
所述目标节点的I/O等待延时tio/wait
11.根据权利要求9所述的装置,其特征在于,根据如下公式计算所述目标节点的实时健康度信息:
其中,H为目标节点的实时健康度信息,T(x)和TH(x)为预设归一化函数,α,β,χ,δ为取值为0到1之间的预设加权系数。
12.根据权利要求9至11中任意一项所述的装置,其特征在于,所述第一计算单元用于根据如下公式计算所述节点i的下发概率P:
其中,W为可用节点的数量,为根据所述节点i的实时健康度在预设周期T内计算得到的所述节点i的平均健康度。
13.根据权利要求12所述的装置,其特征在于,还包括:第二计算单元,用于以预设时间T为周期,计算在所述周期内返回任务请求的处理结果的节点i的平均健康度所述计算单元包括:
第二确定子单元,用于根据存储的所述节点i的实时健康度确定对应的实时健康度等级;
第三确定子单元,用于根据所述实时健康度等级确定对应的实时加权系数;
第二计算子单元,用于以预设时间T为加权周期,根据所述实时加权系数对所述节点i的实时健康度进行加权,得到所述节点在T内的平均健康度
14.一种集群服务系统,包括网络负载均衡装置和服务节点,其特征在于,
所述网络负载均衡装置在有待下发的任务请求时,获取预先存储的集群服务系统中可用的服务节点的健康度信息,并根据所述服务节点的健康度信息计算所述节点的下发概率和健康度等级,并根据所述下发概率和健康度等级选择发送任务请求的第一目标节点和第二目标节点,以及分别向所述第一目标节点和第二目标节点发送所述任务请求;接收并采纳所述第一目标节点反馈的所述任务请求的处理结果,并分别接收所述第一目标节点和第二目标节点在反馈所述任务请求的处理结果时发送的实时健康度参数,并根据所述实时健康度参数分别计算并存储相应目标节点的健康度信息;
其中,所述第一目标节点为根据所述健康度等级选择的正常健康等级的节点,所述第二目标节点为根据所述健康度等级选择的不健康等级的节点。
15.根据权利要求14所述的集群服务系统,其特征在于,所述目标节点的实时健康度参数包括:
所述任务请求在所述目标节点的任务队列中的队列延时tqueue,和/或
所述目标节点处理所述任务请求的延时tprocess,和/或
所述任务请求到达所述目标节点的网络延时tnet,和/或
所述目标节点的I/O等待延时tio/wait
CN201810902938.0A 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统 Pending CN109274710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810902938.0A CN109274710A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510075547.2A CN104639645A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统
CN201810902938.0A CN109274710A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201510075547.2A Division CN104639645A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统

Publications (1)

Publication Number Publication Date
CN109274710A true CN109274710A (zh) 2019-01-25

Family

ID=53217946

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510075547.2A Pending CN104639645A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统
CN201810902938.0A Pending CN109274710A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510075547.2A Pending CN104639645A (zh) 2015-02-12 2015-02-12 网络负载均衡方法、装置及集群服务系统

Country Status (1)

Country Link
CN (2) CN104639645A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111614747A (zh) * 2020-05-18 2020-09-01 北京奇艺世纪科技有限公司 一种信息处理方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630870B (zh) * 2015-12-16 2017-06-30 广州神马移动信息科技有限公司 搜索请求处理方法及系统
CN107132990B (zh) * 2016-02-26 2021-05-04 深信服科技股份有限公司 基于超融合存储的读io调度方法及装置
CN108718338B (zh) * 2018-05-23 2021-06-15 深圳市茁壮网络股份有限公司 一种节点确定方法及装置
CN108989080B (zh) * 2018-05-29 2021-02-05 华为技术有限公司 管理节点的方法和装置
CN108933822B (zh) * 2018-06-28 2019-10-18 北京百度网讯科技有限公司 用于处理信息的方法和装置
CN109376043A (zh) * 2018-10-18 2019-02-22 郑州云海信息技术有限公司 一种设备监测的方法和装置
CN110430141B (zh) * 2019-08-08 2022-08-09 北京字节跳动网络技术有限公司 限流方法及装置
CN111404595B (zh) * 2020-03-20 2021-04-06 西安电子科技大学 一种天基网络通信卫星健康度评估方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、系统和主服务器
CN101753444A (zh) * 2009-12-31 2010-06-23 卓望数码技术(深圳)有限公司 一种负载均衡方法和负载均衡装置
CN102137128A (zh) * 2010-01-27 2011-07-27 腾讯科技(深圳)有限公司 一种集群服务的负载均衡方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101431520A (zh) * 2008-12-24 2009-05-13 金蝶软件(中国)有限公司 一种建立连接的方法、重定向连接的方法及相关设备
CN101605092A (zh) * 2009-07-10 2009-12-16 浪潮电子信息产业股份有限公司 一种基于内容的负载均衡系统
CN101753461B (zh) * 2010-01-14 2012-07-25 中国建设银行股份有限公司 实现负载均衡的方法、负载均衡服务器以及集群系统
CN101986272A (zh) * 2010-11-05 2011-03-16 北京大学 一种云计算环境下的任务调度方法
US9172557B2 (en) * 2012-08-17 2015-10-27 International Business Machines Corporation Load balancing overlay network traffic using a teamed set of network interface cards

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、系统和主服务器
CN101753444A (zh) * 2009-12-31 2010-06-23 卓望数码技术(深圳)有限公司 一种负载均衡方法和负载均衡装置
CN102137128A (zh) * 2010-01-27 2011-07-27 腾讯科技(深圳)有限公司 一种集群服务的负载均衡方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭政慧: "一种基于健康度的负载均衡算法在图书馆多媒体中的应用", 《现代图书情报技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111614747A (zh) * 2020-05-18 2020-09-01 北京奇艺世纪科技有限公司 一种信息处理方法及装置
CN111614747B (zh) * 2020-05-18 2023-03-10 北京奇艺世纪科技有限公司 一种信息处理方法及装置

Also Published As

Publication number Publication date
CN104639645A (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN109274710A (zh) 网络负载均衡方法、装置及集群服务系统
US11888756B2 (en) Software load balancer to maximize utilization
US20180247265A1 (en) Task grouping method and apparatus, electronic device, and computer storage medium
US20230093389A1 (en) Service request allocation method and apparatus, computer device, and storage medium
CN104580538B (zh) 一种提高Nginx服务器负载均衡效率的方法
CN103716251B (zh) 用于内容分发网络的负载均衡方法及设备
US7203747B2 (en) Load balancing system and method in a multiprocessor system
Khazaei et al. Modelling of cloud computing centers using M/G/m queues
US7467291B1 (en) System and method for calibrating headroom margin
US9098343B2 (en) Method and system for managing allocation of tasks to be crowdsourced
CN110365748A (zh) 业务数据的处理方法和装置、存储介质及电子装置
US20170237684A1 (en) Decentralized resource allocation
CN108933829A (zh) 一种负载均衡方法及装置
CN108134830A (zh) 基于消息队列的负载均衡方法、系统、装置及存储介质
CN107295048A (zh) 负载均衡方法及装置
CN105007336B (zh) 服务器的负载均衡方法及其系统
CN109831524A (zh) 一种负载均衡处理方法及装置
CN109032800A (zh) 一种负载均衡调度方法、负载均衡器、服务器及系统
CN106230992B (zh) 一种负载均衡方法和负载均衡节点
CN106952085B (zh) 一种数据存储与业务处理的方法及装置
Menasce Trade-offs in designing Web clusters
Vashistha et al. Comparative study of load balancing algorithms
CN104301241B (zh) 一种soa动态负载分发方法与系统
CN116909735A (zh) 算力调度方法及装置、服务器和存储介质
CN105824919B (zh) 一种数据查询操作定价的动态调整方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200812

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 12 layer self unit 01

Applicant before: GUANGZHOU SHENMA MOBILE INFORMATION TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190125