CN107483634A - 一种负载均衡方法以及系统 - Google Patents

一种负载均衡方法以及系统 Download PDF

Info

Publication number
CN107483634A
CN107483634A CN201710858467.3A CN201710858467A CN107483634A CN 107483634 A CN107483634 A CN 107483634A CN 201710858467 A CN201710858467 A CN 201710858467A CN 107483634 A CN107483634 A CN 107483634A
Authority
CN
China
Prior art keywords
client
cluster
load
load information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710858467.3A
Other languages
English (en)
Other versions
CN107483634B (zh
Inventor
孙健波
王拓
吕桂华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Original Assignee
SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd filed Critical SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Priority to CN201710858467.3A priority Critical patent/CN107483634B/zh
Publication of CN107483634A publication Critical patent/CN107483634A/zh
Application granted granted Critical
Publication of CN107483634B publication Critical patent/CN107483634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例公开了一种负载均衡方法以及系统,所述负载均衡方法包括:当接收到客户端的请求信息时,获取所述客户端的负载信息;根据所述负载信息将所述客户端分配至对应的目标集群;侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载。本发明实施例能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。

Description

一种负载均衡方法以及系统
技术领域
本发明涉及计算机技术,尤其涉及一种负载均衡方法以及系统。
背景技术
随着云计算的不断发展,对数据的高可用、资源弹性扩容、规模可无限扩展等需求越来越强烈。随着规模的增长,大量机器构成的集群资源很难被充分利用,往往会由于负载不均衡导致单个机器资源达到上限,使得集群吞吐量达到瓶颈,需要成倍的扩容机器才能增强原有的计算能力。而这样的扩容又会导致更多的机器资源无法充分利用,使得成本不断提升。
因此,如何充分利用机器资源,提升集群吞吐量,是本领域亟待解决的问题。
发明内容
本发明实施例提供一种负载均衡方法以及系统,能够提高资源利用率,提升集群吞吐量。
本发明实施例第一方面提供了一种负载均衡方法,应用于云服务器,所述云服务器包括至少一个集群,所述方法包括:
当接收到客户端的请求信息时,获取所述客户端的负载信息;
根据所述负载信息将所述客户端分配至对应的目标集群;
侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载。
可选的,所述获取所述客户端的负载信息,包括:
统计预设时间段内所述客户端每分钟进入集群的数据流量;
根据所述数据流量采用回归算法计算所述客户端的负载信息,所述负载信息包括流量大小以及历史流量信息;
根据所述历史流量信息计算所述客户端的历史流量偏离度。
可选的,所述根据所述负载信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小低于预设第一流量阈值或者历史流量信息少于预设数目时,将所述客户端分配至第一集群;
统计所述客户端在所述第一集群的负载信息。
可选的,所述根据所述负载信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度低于预设值时,将所述客户端分配至第二集群;
统计所述客户端在所述第二集群的负载信息。
可选的,所述根据所述服装信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度高于预设值时,将所述客户端分配至第三集群;
将所述客户端对应的流量与所述第三集群绑定。
可选的,所述统计所述客户端在所述第一集群的负载信息之后,还包括:
解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值;
当所述流量预测值大于预设第二流量阈值时,将所述客户端从所述第一集群切换至第二集群。
可选的,所述统计所述客户端在所述第二集群的负载信息之后,还包括:
解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值;
当所述流量预测值小于预设第一流量阈值时,将所述客户端从所述第二集群切换至第一集群。
可选的,所述侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载,包括:
计算负载信息与资源粒度的对应关系,其中所述资源粒度对应预设规格的单位硬件;
获取所述目标集群对应的所有客户端负载信息;
根据所有客户端负载信息为所述目标集群配置相应的资源粒度数;
实时侦测所述目标集群内客户端的吞吐量,当吞吐量超过预设区间时,调节所述资源粒度数,所述吞吐量包括写入流量以及读取流量。
可选的,所述接收到客户端的请求信息之前,还包括:
统计预设数量的客户端的负载信息,根据所述负载信息将所述至少一个集群划分为至少一个类别。
本发明实施例第二方面提供了一种负载均衡系统,应用于云服务器,所述云服务器包括至少一个集群,所述负载均衡系统用于实现上述所述的负载均衡方法。
实施本发明实施例,具有如下有益效果:
本发明实施例通过获取客户端的负载信息,根据负载信息有针对性的配置客户端至不同的集群,从而能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种负载均衡方法的实施环境图。
图2为本发明实施例提供的一种负载均衡方法一种实施方式的方法流程图。
图3为本发明实施例中获取客户端负载信息的方法流程图。
图4为本发明实施例中将客户端分配至对应目标集群的方法流程图。
图5为本发明实施例中将客户端分配至对应目标集群的方法流程图。
图6为本发明实施例中将客户端分配至对应目标集群的方法流程图。
图7为本发明实施例中集群的结构示意图。
图8为本发明实施例提供的一种负载均衡方法另一实施方式的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明实施例提供的一种负载均衡方法的实施环境图。本发明实施例中的负载均衡方法应用于云服务器,所述云服务器包括至少一个集群,所述集群包括至少一个服务器,所述云服务器为客户端提供相应的云服务。如图1所示,云服务器10用于为客户端20提供云服务,其中,客户端20的数量为多个。云服务器10包括集群101、集群102以及集群103。集群101又进一步包括多个服务器。本领域技术人员可以理解的是,本实施例中的云服务器架构、集群的数量以及服务器的数量也可以是其他形式,本发明实施例并不以此为限。
图2为本发明实施例提供的一种负载均衡方法一种实施方式的方法流程图。本实施例中,该方法包括以下步骤S201-S203。
在步骤S201中,当接收到客户端的请求信息时,获取所述客户端的负载信息。
具体的,当云服务器接收到客户端的请求信息时,获取该客户端的负载信息,其中负载信息包括该客户端的历史流量信息。由于不同客户端的具体使用情况不同,流量使用也会有高低之分,对流量的稳定性要求也不同。根据客户端的历史流量信息,能够更加精确的判断客户端后续的可能流量情况,从而便于后续的负载均衡操作。
在步骤S202中,根据所述负载信息将所述客户端分配至对应的目标集群。
具体的,在获取到负载信息了之后,根据客户端的负载类型将客户端分配至对应的集群。比如,若客户端的流量较小,则可以分配至资源弹性大的集群;若客户端的流量较大,则可以分配至比较稳定的集群;若客户端的流量较大且极不稳定,则可以考虑分配至采用专属的集群。通过根据客户端具体的流量特性,分配至对应的集群。
在步骤S203中,侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载。
具体的,在分配至相对应的集群了之后,侦测目标集群的吞吐量,当吞吐量发生变化时,实时调节相应的负载。由于客户端的流量会发生变化,当集群内的吞吐量发生改变时,若超过相应的设置阈值,则需要调节对应的负载。比如,通过添加相应的机器来增加资源,或者是通过关闭相应的服务器来减少资源,从而实现负载动态均衡,提高资源利用率。
上述可知,本发明实施例中的负载均衡方法,通过获取客户端的负载信息,根据负载信息有针对性的配置客户端至不同的集群,从而能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
图3为本发明实施例中获取客户端负载信息的方法流程图。可以理解的是,图3所示的获取负载信息的方法可以应用于图2所示的实施例中,该方法包括步骤S301-S303。
在步骤S301中,统计预设时间段内所述客户端每分钟进入集群的数据流量。
具体的,在统计用户流量时,可以先构建基本的集群,比如,可以采用Elasticsearch构建基本集群,在该集群基础上,统计预设时间段内客户端每分钟进入集群的数据流量。所述数据流量包括客户端每分钟打入Elasticsearch的数据流量,所述数据流量包括写入以及读取。
在步骤S302中,根据所述数据流量采用回归算法计算所述客户端的负载信息,所述负载信息包括流量大小以及历史流量信息。
具体的,在获取到相应的数据流量之后,可以利用机器学习的算法进行预测。在本实施例中,采用线性回归算法,根据该客户端每分钟的数据流量可以计算出该客户端的负载信息,该负载信息可以是该客户端每个时间单位的可能流量负载,该时间单位可以是分钟、小时或者天。本实施例中,所述负载信息包括流量大小以及历史流量信息。
在步骤S303中,根据所述历史流量信息计算所述客户端的历史流量偏离度。
具体的,根据客户顿的历史流量信息计算相应的偏离度,其中,所述偏离度是指所述客户端的历史流量信息的波动大小。比如,若该客户端的历史流量信息中,平均值为500MB,但最小值为10MB,最大值为2000MB,可以认为该客户端流量波动较大,偏离度较高;若该客户端的历史流量信息中,平均值为200MB,最小值为160MB,最大值为220MB,可以认为该客户端流量波动较小,偏离度较小。可以理解的是,计算偏离度还可以采取其他方式,本发明实施例并不以此为限。
通过统计客户端的流量信息,预测该客户端的流量情况,从而能够便于将客户端对应值相应的集群,便于后续的负载平衡。
本实施例中,不同的客户端类型可对应不同的集群。针对不同的客户端,可以预先将集群分为多个类型,不同类型的集群对应着不同流量特性的客户端,可以理解的是,一个类型下可以对应多个集群。比如:可以设置弹性、稳定以及专属三个类别。其中,弹性类别的集群可以用于负载流量较小的客户端,或者是没有历史流量信息的客户端;稳定类别的集群可以用于负载流量较大且流量较稳定的客户端;专属类别的集群可以用于负载流量较大且不稳定的客户端,或者是需要专属服务的特殊客户端。可以理解的是,根据客户端具体的流量情况的不同,分类也可以是其他方式,分类之后的集群也可以相互转化以动态适应,本发明实施例并不以此为限。
下面结合图4-6,介绍本发明实施例提供的负载均衡方法中将客户端分配集群的步骤。图4-6为本发明实施例中将客户端分配至对应目标集群的方法流程图。
如图4所示,图4给出了当客户端流量较小时的操作步骤,该步骤包括S401-S404。
在步骤S401中,当所述客户端的流量大小低于预设第一流量阈值或者历史流量信息少于预设数目时,将所述客户端分配至第一集群。
具体的,当客户端的历史流量信息少于预设数目时,表面该客户端为新用户,或者当客户端的流量大小低于预设第一流量阈值时,由于判断条件较小,客户端后续的流量可能会有很大弹性,为了便于后续处理,可以将该客户端分配至第一集群。在本实施例中,第一集群用于负载小流量以及没有历史数据的客户端,第一集群为弹性类别的集群。在构建第一集群时,可以选用配置较弱的服务器组建,第一集群的资源总量也可以较小,第一集群的资源利用率也允许在较低的范围。
在步骤S402中,统计所述客户端在所述第一集群的负载信息。
具体的,当客户端加入第一集群提供的服务时,开始统计该客户端在第一集群的负载信息。由于客户端可能是新用户,为了更好的提供服务,对客户端的负载信息进行后续的监控,以判断是否需要进行后续操作。
在步骤S403中,解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值。
具体的,在统计了一段时期的负载信息了之后,根据负载信息计算该客户端的流量预测值,本实施例中,可以采取类似步骤S302中的线性回归算法,也可以采取其他方式,本实施例并不以此为限。
在步骤S404中,当所述流量预测值大于预设第二流量阈值时,将所述客户端从所述第一集群切换至第二集群。
具体的,当流量预测值大于预设第二流量阈值时,表面该客户端后续流量会较大,此时为了便于负载平衡,可以将客户端迁移至第二集群,即将该客户端从对应弹性类别的集群,迁移至对应稳定类别的集群。
下面结合图5详细介绍第二集群。图5给出了当客户端流量较大时的操作步骤,该步骤包括S501-S504。
在步骤S501中,当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度低于预设值时,将所述客户端分配至第二集群。
具体的,当客户端的流量高于预设第二流量阈值且历史流量偏离度较低时,表面该客户端对流量需求高,流量使用也比较稳定,此时为了该客户端提供稳定的服务,将该客户端分配至第二集群。本实施例中,第二集群用于负载大流量且历史数据稳定的客户端,第二集群为稳定类别的集群。在构建第二集群时,集群规模可以设置的较大,数量也可以设置的较多,因为大部分客户端都会处于第二集群,因此,对第二集群的资源利用率要保证较高,只有在高于一定阈值时才能扩容。
在步骤S502中,统计所述客户端在所述第二集群的负载信息。
具体的,与步骤S402中类似,在客户端加入第二集群提供的服务之后,统计客户端在第二集群的负载信息。
在步骤S503中,解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值。
具体的,在统计了一段时期的负载信息了之后,根据负载信息计算该客户端的流量预测值,本实施例中,可以采取类似步骤S302中的线性回归算法,也可以采取其他方式,本实施例并不以此为限。
在步骤S504中,当所述流量预测值小于预设第一流量阈值时,将所述客户端从所述第二集群切换至第一集群。
具体的,当客户端的流量低于预设第一流量阈值时,表明该客户端从一个稳定的流量使用状态有所变化,此时为了提高第二集群的资源利用率,可以将该客户端从第二集群切换至第一集群,即将该客户端从对应稳定类别的集群,迁移至弹性类别的集群。
如图6所示,图6给出了当客户端流量较大且波动也较大时的操作步骤,该步骤包括S601-S602。
在步骤S601中,当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度高于预设值时,将所述客户端分配至第三集群。
具体的,当该客户端的流量大于预设第二流量阈值时,不同于步骤S501中,此时客户端的历史流量偏离度高于预设值,表面该客户端的流量波动较大,比较不稳定,若分配至第二集群,则在流量较低时会带来资源利用率低的问题。因此,本实施例中,将该客户端分配至第三集群。第三集群用于负载历史流量大且流量不稳定的客户端,第三集群为专属类别的集群。在构建第三集群时,可以预先与相应的客户端进行绑定。在其他实施方式中,当客户端需要专属化服务时,可以采取第三集群的方式,构建专门的集群用于固定化的对接服务,以避免负载均衡时带来的波动。
在步骤S602中,将所述客户端对应的流量与所述第三集群绑定。
具体的,在分配至第三集群了之后,将客户端对应的流量与第三集群绑定,从而保证后续该客户端的流量负载转移到第三集群。
图7给出了三种类别集群的结构示意图。如图7所示,第一集群701用于负载小流量以及没有历史数据的客户端,第二集群702用于负载大流量且历史数据稳定的客户端,第三集群703用于负载历史流量大且流量不稳定的客户端。本实施例中,第一集群701为弹性类别,第二集群702位稳定类别,第三集群703位专属类别。可以理解的是,每个类别的集群数量可以为多个。在具体实现上,可以通过为集群添加相应的标签来实现,比如为A集群添加弹性标签,则表明该A集群为第一集群,可以为负载小流量的客户端提供服务。在构建集群时,同一类别的集群中,服务器的配置可以尽量相同或者相似,便于后续的负载均衡。比如,第一集群包括10台服务器,那么这10台服务器的配置可以尽量相同,包括CPU、内存、网卡、磁盘、操作系统等配置。
此外,当第一集群701中的客户端流量变大时,当流量超过第二流量阈值时,将对应的客户端迁移至第二集群702,以便于更好的提供服务;同样的,当第二集群702中的客户端流量变小,低于第一流量阈值时,可以将对应的客户端迁移至第一集群701,以提高各自的资源利用率。
在其他实施方式中,在构建集群时,可以预先统计预设数量的客户端的负载信息,根据所述负载信息将所述至少一个集群划分为至少一个类别。比如,先以普通集群运行预设时间段,统计预设数量的客户端负载信息,然后根据负载信息将集群进行划分类别。可以理解的是,划分的集群类别不限于本发明实施例提供的三种类别,还可以是其他形式,本发明实施例并不以此为限。
上述可知,本发明实施例中的负载均衡方法,通过获取客户端的负载信息,根据负载信息有针对性的配置客户端至不同类别的集群,同时不同集群类别之间还可以相互迁移,从而能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
图8为本发明实施例提供的一种负载均衡方法另一实施方式的方法流程图。在本实施例中,相对于图2所示的实施例,进一步的包括了如何调节负载的步骤,该方法包括步骤:S801-S806。
在步骤S801中,当接收到客户端的请求信息时,获取所述客户端的负载信息。
具体的,当云服务器接收到客户端的请求信息时,获取该客户端的负载信息,其中负载信息包括该客户端的历史流量信息。由于不同客户端的具体使用情况不同,流量使用也会有高低之分,对流量的稳定性要求也不同。根据客户端的历史流量信息,能够更加精确的判断客户端后续的可能流量情况,从而便于后续的负载均衡操作。
在步骤S802中,根据所述负载信息将所述客户端分配至对应的目标集群。
具体的,在获取到负载信息了之后,根据客户端的负载类型将客户端分配至对应的集群。比如,若客户端的流量较小,则可以分配至资源弹性大的集群;若客户端的流量较大,则可以分配至比较稳定的集群;若客户端的流量较大且极不稳定,则可以考虑分配至采用专属的集群。通过根据客户端具体的流量特性,分配至对应的集群。
在步骤S803中,计算负载信息与资源粒度的对应关系,其中所述资源粒度对应预设规格的单位硬件。
具体的,可以通过压力测试的方式计算负载信息与资源粒度的对应关系。本实施例中,资源粒度是指预设规格的单位硬件,所述预设规格包括CPU、内存、硬盘以及网卡的规格。比如,该预设规格可以是CPU为1核、内存为4GB、硬盘为500GB、网卡为1000Mbps。通过对该预设规格的服务器进行压力测试,可以获得资源粒度对应的负载信息。
在步骤S804中,获取所述目标集群对应的所有客户端负载信息。
具体的,在将客户端分配至目标集群了之后,统计目标集群对应的所有客户端的负载信息。
在步骤S805中,根据所有客户端负载信息为所述目标集群配置相应的资源粒度数。
具体的,根据计算资源粒度和负载的对应关系,根据所有客户端的负载信息,为目标集群配置相应的资源粒度数。比如,单位硬件对应的负载为10MB/s的流量写入负载与1MB/s的流量读取负载,当所有客户端的负载信息为1000MB/s的流量写入负载与100MB/s的流量读取负载时,此时需要配置的资源粒度数为100。
在步骤S806中,实时侦测所述目标集群内客户端的吞吐量,当吞吐量超过预设区间时,调节所述资源粒度数。
具体的,对目标集群内客户端的吞吐量进行实时侦测,其中,所述吞吐量包括写入流量以及读取流量。当吞吐量超过预设区间时,比如高于区间最高值或者低于区间最低值时,需要对资源粒度数进行调节。比如高于区间最高值时,表明当前负载较高,需要增加资源粒度。具体的,增加或者减少资源粒度可以通过配置路由的方式或者其他方式实现,本实施例并不以此为限。
上述可知,本发明实施例中的负载均衡方法,通过获取客户端的负载信息,根据负载信息有针对性的配置客户端至不同的集群,从而能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
本发明实施例还提供了一种负载均衡系统,所述负载均衡系统应用于云服务器,所述云服务器包括至少一个集群,所述负载均衡系统可用于实现图2-图8所示的负载均衡方法,以能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
在其他实施方式中,所述负载均衡系统包括处理器以及存储器,所述存储器用于存储可执行程序指令,所述处理器用于执行所述可执行程序指令,以实现图2-图8所示的负载均衡方法,以能够根据客户端的具体情况充分利用集群资源,提升集群资源利用率,提高整体吞吐量,降低运维成本。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为根据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的模块、单元可以根据实际需要进行合并、划分和删减。本领域的技术人员可以将本说明书中描述的不同实施例以及不同实施例的特征进行结合或组合。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(Digital Subscriber Line,DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种负载均衡方法,应用于云服务器,其特征在于,所述云服务器包括至少一个集群,所述方法包括:
当接收到客户端的请求信息时,获取所述客户端的负载信息;
根据所述负载信息将所述客户端分配至对应的目标集群;
侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载。
2.如权利要求1所述的负载均衡方法,其特征在于,所述获取所述客户端的负载信息,包括:
统计预设时间段内所述客户端每分钟进入集群的数据流量;
根据所述数据流量采用回归算法计算所述客户端的负载信息,所述负载信息包括流量大小以及历史流量信息;
根据所述历史流量信息计算所述客户端的历史流量偏离度。
3.如权利要求2所述的负载均衡方法,其特征在于,所述根据所述负载信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小低于预设第一流量阈值或者历史流量信息少于预设数目时,将所述客户端分配至第一集群;
统计所述客户端在所述第一集群的负载信息。
4.如权利要求2所述的负载均衡方法,其特征在于,所述根据所述负载信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度低于预设值时,将所述客户端分配至第二集群;
统计所述客户端在所述第二集群的负载信息。
5.如权利要求2所述的负载均衡方法,其特征在于,所述根据所述服装信息将所述客户端分配至对应的目标集群,包括:
当所述客户端的流量大小高于预设第二流量阈值且所述客户端的历史流量偏离度高于预设值时,将所述客户端分配至第三集群;
将所述客户端对应的流量与所述第三集群绑定。
6.如权利要求3所述的负载均衡方法,其特征在于,所述统计所述客户端在所述第一集群的负载信息之后,还包括:
解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值;
当所述流量预测值大于预设第二流量阈值时,将所述客户端从所述第一集群切换至第二集群。
7.如权利要求4所述的负载均衡方法,其特征在于,所述统计所述客户端在所述第二集群的负载信息之后,还包括:
解析所述负载信息,根据所述负载信息计算所述客户端的流量预测值;
当所述流量预测值小于预设第一流量阈值时,将所述客户端从所述第二集群切换至第一集群。
8.如权利要求3所述的负载均衡方法,其特征在于,所述侦测所述目标集群的吞吐量,根据所述吞吐量调节所述目标集群中服务器的负载,包括:
计算负载信息与资源粒度的对应关系,其中所述资源粒度对应预设规格的单位硬件;
获取所述目标集群对应的所有客户端负载信息;
根据所有客户端负载信息为所述目标集群配置相应的资源粒度数;
实时侦测所述目标集群内客户端的吞吐量,当吞吐量超过预设区间时,调节所述资源粒度数,所述吞吐量包括写入流量以及读取流量。
9.如权利要求2所述的负载均衡方法,其特征在于,所述接收到客户端的请求信息之前,还包括:
统计预设数量的客户端的负载信息,根据所述负载信息将所述至少一个集群划分为至少一个类别。
10.一种负载均衡系统,应用于云服务器,其特征在于,所述云服务器包括至少一个集群,所述负载均衡系统用于实现如权利要求1-9任一项所述的负载均衡方法。
CN201710858467.3A 2017-09-21 2017-09-21 一种负载均衡方法以及系统 Active CN107483634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710858467.3A CN107483634B (zh) 2017-09-21 2017-09-21 一种负载均衡方法以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710858467.3A CN107483634B (zh) 2017-09-21 2017-09-21 一种负载均衡方法以及系统

Publications (2)

Publication Number Publication Date
CN107483634A true CN107483634A (zh) 2017-12-15
CN107483634B CN107483634B (zh) 2020-04-21

Family

ID=60586685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710858467.3A Active CN107483634B (zh) 2017-09-21 2017-09-21 一种负载均衡方法以及系统

Country Status (1)

Country Link
CN (1) CN107483634B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110012065A (zh) * 2019-02-25 2019-07-12 贵州格物数据有限公司 一种基于虚拟技术的资源调度平台及方法
CN110661824A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法以及装置
CN112866131A (zh) * 2020-12-30 2021-05-28 神州绿盟成都科技有限公司 一种流量负载均衡方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140101226A1 (en) * 2012-10-08 2014-04-10 Motorola Mobility Llc Methods and apparatus for performing dynamic load balancing of processing resources
CN104243337A (zh) * 2013-06-09 2014-12-24 杭州华三通信技术有限公司 一种跨集群负载均衡的方法及装置
CN104852934A (zh) * 2014-02-13 2015-08-19 阿里巴巴集团控股有限公司 基于前端调度实现流量分配的方法、装置和系统
CN105282191A (zh) * 2014-06-20 2016-01-27 中国电信股份有限公司 负载均衡系统、控制器和方法
US20160321352A1 (en) * 2015-04-30 2016-11-03 Splunk Inc. Systems and methods for providing dynamic indexer discovery

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140101226A1 (en) * 2012-10-08 2014-04-10 Motorola Mobility Llc Methods and apparatus for performing dynamic load balancing of processing resources
CN104243337A (zh) * 2013-06-09 2014-12-24 杭州华三通信技术有限公司 一种跨集群负载均衡的方法及装置
CN104852934A (zh) * 2014-02-13 2015-08-19 阿里巴巴集团控股有限公司 基于前端调度实现流量分配的方法、装置和系统
CN105282191A (zh) * 2014-06-20 2016-01-27 中国电信股份有限公司 负载均衡系统、控制器和方法
US20160321352A1 (en) * 2015-04-30 2016-11-03 Splunk Inc. Systems and methods for providing dynamic indexer discovery

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110661824A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法以及装置
CN110661824B (zh) * 2018-06-28 2022-04-12 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法及存储介质
CN110012065A (zh) * 2019-02-25 2019-07-12 贵州格物数据有限公司 一种基于虚拟技术的资源调度平台及方法
CN112866131A (zh) * 2020-12-30 2021-05-28 神州绿盟成都科技有限公司 一种流量负载均衡方法、装置、设备及介质

Also Published As

Publication number Publication date
CN107483634B (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
US11805073B2 (en) Controlling placement of workloads of an application within an application environment
CN105637925B (zh) 具有细化策略管理的动态频率和功率资源分配
CN110753131A (zh) 微服务分布式限流方法及装置、存储介质和电子设备
CN109819057A (zh) 一种负载均衡方法及系统
CN107301093B (zh) 一种管理资源的方法和装置
CN112165691A (zh) 内容分发网络调度方法、装置、服务器和介质
CN105264509A (zh) 融合网络中的自适应中断联合
CN108900434A (zh) 数据收集分发方法及装置
CN107483634A (zh) 一种负载均衡方法以及系统
WO2019062405A1 (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN107295090A (zh) 一种资源调度的方法和装置
CN110351366A (zh) 一种互联网应用的服务调度方法、系统及计算机可读存储介质
US11750711B1 (en) Systems and methods for adaptively rate limiting client service requests at a blockchain service provider platform
CN105227489A (zh) 一种带宽管理方法及电子设备
US11190581B1 (en) Job allocation support system and method
CN108809848A (zh) 负载均衡方法、装置、电子设备及存储介质
CN110796400B (zh) 一种缓存货物的方法和装置
US8745232B2 (en) System and method to dynamically allocate electronic mailboxes
CN112799824A (zh) 一种限流方法、装置、设备和存储介质
WO2019062404A1 (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN113765964A (zh) 一种分布式系统服务分发的方法和装置
CN112905119B (zh) 一种分布式存储系统的数据写入控制方法、装置及设备
CN110278226A (zh) 负载均衡处理方法、装置及电子设备
US11687116B2 (en) Intelligent user equipment central processing unit core clock adjustment
EP3599547B1 (en) Elastic storage volume type selection and optimization engine for public cloud environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant