CN103546542A - 服务器负载均衡方法和装置 - Google Patents

服务器负载均衡方法和装置 Download PDF

Info

Publication number
CN103546542A
CN103546542A CN201310456198.XA CN201310456198A CN103546542A CN 103546542 A CN103546542 A CN 103546542A CN 201310456198 A CN201310456198 A CN 201310456198A CN 103546542 A CN103546542 A CN 103546542A
Authority
CN
China
Prior art keywords
server
application
threshold value
throughput
described server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310456198.XA
Other languages
English (en)
Other versions
CN103546542B (zh
Inventor
孙海龙
刘旭东
赵涛
唐宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianhang Changying (Jiangsu) Technology Co.,Ltd.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201310456198.XA priority Critical patent/CN103546542B/zh
Publication of CN103546542A publication Critical patent/CN103546542A/zh
Application granted granted Critical
Publication of CN103546542B publication Critical patent/CN103546542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明提供一种服务器负载均衡方法和装置。该方法包括:接收并解析用户提交的包括应用请求、应用请求所属应用的标识以及应用的已部署服务器列表的应用请求信息,服务器列表中的每个服务器中可部署至少一个应用;将应用请求发送至服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量和吞吐量阈值分别根据部署在各服务器中的每个应用的请求到达率和在单应用环境下的请求到达率阈值得到。本发明提供的服务器负载均衡方法和装置,通过将应用请求发送至吞吐量小于吞吐量阈值的服务器中,有效地保证了服务器中所有应用的服务质量需求。

Description

服务器负载均衡方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务器负载均衡方法和装置。
背景技术
近年来随着互联网技术的不断发展,云计算在商业界与学术界都得到了广泛的应用与研究。云计算的关键特征是按需提供服务,根据云计算中提供的服务的层次,可以将云计算的主要服务分为云应用、云平台及云基础设施3个层次。
多租户(multi-tenancy)技术,也称为多重租赁技术,是一种软件架构技术,用于实现如何在多用户环境下共用相同的系统或程序组件,并确保各用户间数据的隔离性。多租户技术应用于云平台中,是指多个应用共享同一个操作系统实例即同一个服务器。
现有技术中,随着分布式集群等技术的发展,一个网络Web应用能够同时运行于不同的服务器节点中,从而为持续增长的用户提供服务。负载均衡策略,即根据各个服务器的负载情况,把一个应用的多个应用请求分配给不同的服务器节点,使得多个服务器可以同时参与相同的工作,提高应用的伸缩性。
但现有的负载均衡方法,只适用于传统环境(例如分布式集群计算),对于采用多租户技术的云平台,由于未考虑多个应用之间的相互竞争,当分配至某个服务器的应用请求的数量很大时,很可能导致该服务器的负载过大,无法保证部署在该服务器中的所有应用的服务质量需求。
发明内容
本发明提供一种服务器负载均衡方法和装置,用以解决现有技术中存在的对于采用多租户技术的云平台,无法保证所有应用的服务质量需求的问题。
一方面,本发明提供了一种服务器负载均衡方法,包括:
接收并解析用户提交的应用请求信息,所述应用请求信息中包括应用请求、所述应用请求所属应用的标识以及所述应用的已部署服务器列表,所述服务器列表中的每个服务器中可部署至少一个应用;
将所述应用请求发送至所述服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
另一方面,本发明提供了一种服务器负载均衡装置,包括:
接收模块,用于接收并解析用户提交的应用请求信息,所述应用请求信息中包括应用请求、所述应用请求所属应用的标识以及所述应用的已部署服务器列表,所述服务器列表中的每个服务器中可部署至少一个应用;
发送模块,用于将所述应用请求发送至所述服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
本发明提供的服务器负载均衡方法和装置,通过将应用请求发送至可部署至少一个应用且吞吐量小于吞吐量阈值的服务器中,其中服务器的吞吐量和吞吐量阈值根据该服务器中每个应用的请求到达率和在单应用环境下的请求到达率阈值得到,有效地保证了服务器中所有应用的服务质量需求。
附图说明
图1为本发明提供的服务器负载均衡方法一个实施例的流程示意图;
图2为本发明提供的服务器负载均衡方法又一个实施例的流程示意图;
图3为本发明提供的服务器负载均衡装置一个实施例的结构示意图。
具体实施方式
下面通过具体的实施例及附图,对本发明的技术方案做进一步的详细描述。
图1为本发明提供的服务器负载均衡方法一个实施例的流程示意图。如图1所示,该方法具体可以包括:
S101,接收并解析用户提交的应用请求信息,应用请求信息中包括应用请求、应用请求所属应用的标识以及应用的已部署服务器列表,服务器列表中的每个服务器中可部署至少一个应用。
具体的,本实施例提供的服务器负载均衡方法适用于多个应用共享同一个服务器的情况,每个服务器中包括多个中央处理器(CentralProcessing Unit,简称CPU)核心,且服务器中部署的多个应用为CPU密集型应用,即同一个服务器中的多个应用之间存在竞争资源的关系。
接收并解析用户通过客户端等提交的应用请求信息,应用请求信息具体可以为网络Web应用请求信息,例如Servlet等应用请求信息。应用请求信息中包括该应用请求所属应用的标识,用于标识该请求是属于哪个应用的一个请求。应用请求信息中还包括该应用的已部署服务器列表,即每个应用对应的服务器为预先部署好的,每个服务器中可部署多个应用,每个应用的多个应用请求被分配至不同的服务器中,使得多个服务器同时参与相同的工作,提高应用的伸缩性。
S102,将应用请求发送至服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
具体的,将上述服务器列表中的每个服务器的吞吐量和各自的吞吐量阈值进行比较,如果存在吞吐量小于吞吐量阈值的服务器,则将该应用请求发送至该服务器中,如果不存在吞吐量小于吞吐量阈值的服务器,则丢弃该应用请求。每个应用在单应用环境下的请求到达率阈值,即服务器中只部署一个应用的情况下,该应用的请求到达率阈值。
本实施例提供的服务器负载均衡方法,通过将应用请求发送至可部署至少一个应用且吞吐量小于吞吐量阈值的服务器中,其中服务器的吞吐量和吞吐量阈值根据该服务器中多个应用的请求到达率和在单应用环境下的请求到达率阈值得到,有效地保证了服务器中所有应用的服务质量需求。
图2为本发明提供的服务器负载均衡又一个实施例的流程示意图。如图2所示,该方法具体可以包括:
S201,根据服务器中每个应用的平均响应时间阈值,计算服务器的吞吐量阈值。具体为:
根据服务器中每个应用的平均响应时间阈值,计算服务器中每个应用在单应用环境下的请求到达率阈值;
根据服务器中每个应用在单应用环境下的请求到达率阈值、服务器中每个应用的平均处理时间以及服务器的中央处理器核心数量,计算服务器中每个应用在单应用环境下的负载强度阈值;
将服务器中每个应用在单应用环境下的负载强度阈值中的最小值作为服务器的负载强度阈值,并将服务器的负载强度阈值和服务器的中央处理器核心数量相乘,得到服务器的吞吐量阈值。
具体的,本实施例提供的服务器负载均衡方法适用于多个应用共享同一个服务器的情况,每个服务器中包括多个CPU核心,且服务器中部署的多个应用为CPU密集型应用,即同一个服务器中的多个应用之间存在竞争资源的关系。
可以采用排队模型对多应用服务器进行建模,一个典型的排队模型由输入过程、排队规则和服务过程三部分组成。通常假定应用请求的到达过程为泊松过程,排队规则为先来先服务,服务过程为应用请求在服务台中的处理过程,应用请求在服务器中的响应时间为等待时间加上处理时间。
排队过程属于马尔可夫过程,可以用某个时刻服务器中应用请求的数量来表示服务器的状态,应用请求的到达或完成可以用应用请求数量的变化,即服务器状态的转换来表示。假设给定应用请求的到达分布与处理时间分布,则可以构造出该服务器的状态转移概率矩阵。
一个排队模型可以由六个系数表示,例如A/S/c/K/N/D。其中,A表示应用请求到达间隔时间的分布,S表示应用请求的处理时间分布,c表示服务器中CPU核心的数量,K表示服务器最大可容纳的应用请求的数量,N表示应用请求的数量,D表示排队规则。在实际应用中,最后两个系数通常被省略,即表示应用请求的数量为无限多个,且排队规则为先来先服务。
本实施例中,采用的排队模型具体为M/G/s/s+r,其中,M表示应用请求到达间隔时间的分布为泊松分布,G表示应用请求的处理时间分布为一般分布,s表示服务器中CPU核心的数量为s个,r表示队列长度,s+r表示服务器最大可容纳的应用请求的数量为s+r个。由于该模型中应用请求的处理时间为一般分布,因而不再具有负指数分布的无记忆性,目前还没有确定性的解法。鉴于此,本实施例采用T.Kimura的近似方法,得出M/G/s/s+r排队模型在平稳状态下应用请求数量的概率分布如下:
P j = ( sρ ) j j ! P 0 , j = 0 , . . . s - 1 ( sρ ) s s ! 1 - δ 1 - ρ δ j - s P 0 , j = s , . . . s + r - 1 ( sρ ) s s ! δ r P 0 , j = s + r - - - ( 1 )
其中:
P 0 = [ Σ j = 0 s - 1 ( sρ ) j j ! + ( sρ ) s s ! 1 - ρ δ r 1 - ρ ] - 1
δ = ρ R G 1 - ρ + ρ R G - - - ( 3 )
&rho; = &lambda;&mu; s < 1 - - - ( 4 )
其中,RG表示M/G/s模型与M/M/s模型中平均等待时间的比值,Sze给出了该比值的近似解:
R G = EW ( M / G / s ) EW ( M / M / s ) = 1 + C v 2 2 - - - ( 5 )
λ表示应用请求到达率,即单位时间内到达的应用请求的数量。μ表示应用请求处理时间分布的期望,即平均处理时间。Cv表示应用请求处理时间分布的变异系数。ρ表示负载强度。P0表示服务器中无应用请求的概率。
根据公式(1)和科特尔法则,得出M/G/s/s+r排队模型中应用请求的平均响应时间W为:
W = L &lambda; ( 1 - P s + r ) = &Sigma; j = 0 s + r j P j &lambda; ( 1 - P s + r ) - - - ( 6 )
其中,L表示平均应用请求数,Ps+r表示服务器中队列被占满的概率。
尽管由公式(6)可以推导出W的具体形式,但由于其复杂性,因此并没有实际意义。考虑到实际应用中,服务器中队列长度r通常很大,但对W的影响却很小,且W是r的递增函数,因此可以通过对W关于队列长度r取极限,从而消除队列长度r的影响,得到平均响应时间W为:
W = s ! ( s&rho; ) s - 1 &Sigma; j = 0 s - 1 ( s&rho; ) j j ! - s + s - s&delta; + &delta; ( 1 - &rho; ) ( 1 - &delta; ) &lambda; ( s ! ( s&rho; ) s &Sigma; j = 0 s - 1 ( s&rho; ) j j ! + 1 1 - &rho; ) = &mu; + &mu;R G s ( s ! ( &lambda;&mu; ) s &Sigma; j = 0 s - 1 ( &lambda;&mu; ) j j ! ( 1 - &lambda;&mu; s ) 2 + 1 - &lambda;&mu; s ) = &mu; + &Delta; ( &lambda; ) - - - ( 7 )
由于服务器中每个应用的平均响应时间阈值Wmax,每个应用的平均处理时间μ,CPU核心数量s,M/G/s模型与M/M/s模型中平均等待时间的比值RG均为已知参数,根据公式(7),可计算得到服务器中每个应用在单应用环境下的请求到达率阈值λmax
根据计算得到的服务器中每个应用在单应用环境下的请求到达率阈值λmax,以及公式(4),可计算得到服务器中每个应用在单应用环境下的负载强度阈值ρmax
将计算得到的服务器中每个应用在单应用环境下的负载强度阈值ρmax中最小的负载强度阈值ρmax-min作为该服务器的整体负载强度阈值,因此在多应用环境下,当服务器的整体负载强度小于或者等于该服务器的整体负载强度阈值ρmax-min时,该服务器中每个应用的负载强度ρ均小于或者等于各自的负载强度阈值ρmax,而且根据公式(4)和(7)可知,该服务器中每个应用的负载强度ρ和自身的平均响应时间W成正比,因此当服务器的整体负载强度小于或者等于该服务器的整体负载强度阈值ρmax-min时,该服务器中每个应用的平均响应时间W均小于或者等于各自的平均响应时间阈值Wmax。根据公式(4),服务器的整体负载强度小于或者等于该服务器的整体负载强度阈值ρmax-min可以转化为
Figure BDA0000390327650000071
其中,n为该服务器中部署的应用的数量,我们定义不等式左边为服务器的吞吐量,右边为服务器的吞吐量阈值。因此只需要保证服务器的吞吐量小于或者等于服务器的吞吐量阈值,即可保证服务器中每个应用的平均响应时间W均小于或者等于各自的平均响应时间阈值Wmax
根据服务器的整体负载强度阈值ρmax-min,以及CPU核心数量s,计算得到该服务器的吞吐量阈值Tmax=sρmax-min
S202,将服务器中每个应用的平均处理时间和请求到达率的乘积相加,得到服务器的吞吐量。
具体的,假设该服务器中部署有n个应用,则根据服务器中每个应用的平均处理时间μi以及服务器中每个应用的请求到达率λi,计算得到该服务器的吞吐量
Figure BDA0000390327650000072
S203,接收并解析用户提交的应用请求信息,应用请求信息中包括应用请求、应用请求所属应用的标识以及应用的已部署服务器列表,服务器列表中的每个服务器中可部署至少一个应用。
S204,将应用请求发送至服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
步骤S203和S204参见图1所示实施例中关于步骤S101和S102的相关描述,此处不再赘述。
S205,更新服务器的吞吐量。具体为:
更新服务器中该应用的请求到达率;
根据该应用的平均处理时间、更新后服务器中该应用的请求到达率以及服务器中其他应用的平均处理时间以及请求到达率,更新服务器的吞吐量。
具体的,假设应用请求所属的应用为第k(k≤n)个应用,则将应用请求发送至吞吐量小于吞吐量阈值的服务器之后,更新第k个应用的请求到达率λk为λ'kk+1。然后根据第k个应用的平均处理时间μk、更新后第k个应用的请求到达率λ'k以及服务器中其他应用的平均处理时间μi(1≤i≤n,且i≠k)、请求到达率λi(1≤i≤n,且i≠k),更新服务器的吞吐量T为
Figure BDA0000390327650000081
以便于后续接收到应用请求时,准确判断该服务器的吞吐量是否小于吞吐量阈值。
本实施例提供的服务器负载均衡方法,通过将应用请求发送至可部署至少一个应用且吞吐量小于吞吐量阈值的服务器中,其中服务器的吞吐量和吞吐量阈值根据该服务器中每个应用的请求到达率和在单应用环境下的请求到达率阈值得到,使得服务器中每个应用的平均响应时间均小于各自的平均响应时间阈值,有效地保证了服务器中所有应用的服务质量需求。
图3为本发明提供的服务器负载均衡装置一个实施例的结构示意图。如图3所示,本实施例提供的服务器负载均衡装置为执行上述服务器负载均衡方法的特定执行主体。该装置具体可以包括:接收模块31和发送模块32,其中:
接收模块31,用于接收并解析用户提交的应用请求信息,应用请求信息中包括应用请求、应用请求所属应用的标识以及应用的已部署服务器列表,服务器列表中的每个服务器中可部署至少一个应用。
具体的,本实施例提供的服务器负载均衡装置适用于多个应用共享同一个服务器的情况,每个服务器中包括多个CPU核心,且服务器中部署的多个应用为CPU密集型应用,即同一个服务器中的多个应用之间存在竞争资源的关系。
接收模块31接收并解析用户通过客户端等提交的应用请求信息,应用请求信息具体可以为网络Web应用请求信息,例如Servlet等应用请求信息。应用请求信息中包括该应用请求所属应用的标识,用于标识该请求是属于哪个应用的一个请求。应用请求信息中还包括应用的已部署服务器列表,即每个应用对应的服务器为预先部署好的,每个服务器中可部署多个应用,每个应用的多个应用请求被分配至不同的服务器中,使得多个服务器同时参与相同的工作,提高应用的伸缩性。
发送模块32,将应用请求发送至服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
具体的,发送模块32将上述服务器列表中的每个服务器的吞吐量和各自的吞吐量阈值进行比较,如果存在吞吐量小于吞吐量阈值的服务器,则将该应用请求发送至该服务器中,如果不存在吞吐量小于吞吐量阈值的服务器,则丢弃该应用请求。每个应用在单应用环境下的请求到达率阈值,即服务器中只部署一个应用的情况下,该应用的请求到达率阈值。
进一步的,该装置还可以包括:
计算模块33,用于在接收模块31接收用户提交的应用请求信息之前,根据服务器中每个应用的平均响应时间阈值,计算服务器的吞吐量阈值。具体用于:
根据服务器中每个应用的平均响应时间阈值,计算服务器中每个应用在单应用环境下的请求到达率阈值;
根据服务器中每个应用在单应用环境下的请求到达率阈值、服务器中每个应用的平均处理时间以及服务器的中央处理器核心数量,计算服务器中每个应用在单应用环境下的负载强度阈值;
将服务器中每个应用在单应用环境下的负载强度阈值中的最小值作为服务器的负载强度阈值,并将服务器的负载强度阈值和服务器的中央处理器核心数量相乘,得到服务器的吞吐量阈值。
具体的,计算模块33可以采用M/G/s/s+r排队模型对多应用服务器进行建模,根据上述公式(7),计算得到服务器中每个应用在单应用环境下的请求到达率阈值λmax。根据计算得到的服务器中每个应用在单应用环境下的请求到达率阈值λmax,以及公式(4),计算得到服务器中每个应用在单应用环境下的负载强度阈值ρmax。将计算得到的服务器中每个应用在单应用环境下的负载强度阈值ρmax中最小的负载强度阈值ρmax-min作为该服务器的整体负载强度阈值,根据服务器的整体负载强度阈值ρmax-min,以及CPU核心数量s,计算得到该服务器的吞吐量阈值Tmax=sρmax-min。具体过程可以参见图2所示实施例中步骤S201中的相关描述,此处不再赘述。
进一步的,计算模块33还可以用于:
在接收模块31接收用户提交的应用请求信息之前,将服务器中每个应用的平均处理时间和请求到达率的乘积相加,得到服务器的吞吐量。
具体的,假设该服务器中部署有n个应用,则计算模块33根据服务器中每个应用的平均处理时间μi以及服务器中每个应用的请求到达率λi,计算得到该服务器的吞吐量
进一步的,该装置还可以包括:
更新模块34,用于在发送模块32将应用请求发送至服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理之后,更新服务器的吞吐量。具体用于:
更新服务器中该应用的请求到达率;
根据该应用的平均处理时间、更新后服务器中该应用的请求到达率以及服务器中其他应用的平均处理时间以及请求到达率,更新服务器的吞吐量。
具体的,假设应用请求所属的应用为第k(k≤n)个应用,则将应用请求发送至吞吐量小于吞吐量阈值的服务器之后,更新第k个应用的请求到达率λk为λ'kk+1。然后根据第k个应用的平均处理时间μk、更新后第k个应用的请求到达率λ'k以及服务器中其他应用的平均处理时间μi(1≤i≤n,且i≠k)、请求到达率λi(1≤i≤n,且i≠k),更新服务器的吞吐量T为
Figure BDA0000390327650000111
以便于后续接收到应用请求时,准确判断该服务器的吞吐量是否小于吞吐量阈值。
本实施例提供的服务器负载均衡装置,通过将应用请求发送至可部署至少一个应用且吞吐量小于吞吐量阈值的服务器中,其中服务器的吞吐量和吞吐量阈值根据该服务器中每个应用的请求到达率和在单应用环境下的请求到达率阈值得到,使得服务器中每个应用的平均响应时间均小于各自的平均响应时间阈值,有效地保证了服务器中所有应用的服务质量需求。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种服务器负载均衡方法,其特征在于,包括:
接收并解析用户提交的应用请求信息,所述应用请求信息中包括应用请求、所述应用请求所属应用的标识以及所述应用的已部署服务器列表,所述服务器列表中的每个服务器中可部署至少一个应用;
将所述应用请求发送至所述服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
2.根据权利要求1所述的方法,其特征在于,所述接收用户提交的应用请求信息之前,还包括:
根据所述服务器中每个应用的平均响应时间阈值,计算所述服务器的吞吐量阈值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述服务器中每个应用的平均响应时间阈值,计算所述服务器的吞吐量阈值,包括:
根据所述服务器中每个应用的平均响应时间阈值,计算所述服务器中每个应用在单应用环境下的请求到达率阈值;
根据所述服务器中每个应用在单应用环境下的请求到达率阈值、所述服务器中每个应用的平均处理时间以及所述服务器的中央处理器核心数量,计算所述服务器中每个应用在单应用环境下的负载强度阈值;
将所述服务器中每个应用在单应用环境下的负载强度阈值中的最小值作为所述服务器的负载强度阈值,并将所述服务器的负载强度阈值和所述服务器的中央处理器核心数量相乘,得到所述服务器的吞吐量阈值。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述接收用户提交的应用请求信息之前,还包括:
将所述服务器中每个应用的平均处理时间和请求到达率的乘积相加,得到所述服务器的吞吐量。
5.根据权利要求1所述的方法,其特征在于,所述将所述应用请求发送至所述服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理之后,还包括:
更新所述服务器的吞吐量。
6.根据权利要求5所述的方法,其特征在于,所述更新所述服务器的吞吐量,包括:
更新所述服务器中所述应用的请求到达率;
根据所述应用的平均处理时间、更新后所述服务器中所述应用的请求到达率以及所述服务器中其他应用的平均处理时间以及请求到达率,更新所述服务器的吞吐量。
7.一种服务器负载均衡装置,其特征在于,包括:
接收模块,用于接收并解析用户提交的应用请求信息,所述应用请求信息中包括应用请求、所述应用请求所属应用的标识以及所述应用的已部署服务器列表,所述服务器列表中的每个服务器中可部署至少一个应用;
发送模块,用于将所述应用请求发送至所述服务器列表中吞吐量小于吞吐量阈值的服务器中进行处理,各服务器的吞吐量根据部署在各服务器中的每个应用的请求到达率得到,各服务器的吞吐量阈值根据部署在各服务器中的每个应用在单应用环境下的请求到达率阈值得到。
8.根据权利要求7所述的装置,其特征在于,还包括:
计算模块,用于在所述接收模块接收用户提交的应用请求信息之前,根据所述服务器中每个应用的平均响应时间阈值,计算所述服务器的吞吐量阈值。
9.根据权利要求8所述的装置,其特征在于,所述计算模块具体用于:
根据所述服务器中每个应用的平均响应时间阈值,计算所述服务器中每个应用在单应用环境下的请求到达率阈值;
根据所述服务器中每个应用在单应用环境下的请求到达率阈值、所述服务器中每个应用的平均处理时间以及所述服务器的中央处理器核心数量,计算所述服务器中每个应用在单应用环境下的负载强度阈值;
将所述服务器中每个应用在单应用环境下的负载强度阈值中的最小值作为所述服务器的负载强度阈值,并将所述服务器的负载强度阈值和所述服务器的中央处理器核心数量相乘,得到所述服务器的吞吐量阈值。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述计算模块还用于:
在所述接收模块接收用户提交的应用请求信息之前,将所述服务器中每个应用的平均处理时间和请求到达率的乘积相加,得到所述服务器的吞吐量。
CN201310456198.XA 2013-09-29 2013-09-29 服务器负载均衡方法和装置 Active CN103546542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310456198.XA CN103546542B (zh) 2013-09-29 2013-09-29 服务器负载均衡方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310456198.XA CN103546542B (zh) 2013-09-29 2013-09-29 服务器负载均衡方法和装置

Publications (2)

Publication Number Publication Date
CN103546542A true CN103546542A (zh) 2014-01-29
CN103546542B CN103546542B (zh) 2017-01-04

Family

ID=49969581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310456198.XA Active CN103546542B (zh) 2013-09-29 2013-09-29 服务器负载均衡方法和装置

Country Status (1)

Country Link
CN (1) CN103546542B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957246A (zh) * 2014-04-22 2014-07-30 广州杰赛科技股份有限公司 基于租户感知的动态负载均衡方法及系统
CN103997526A (zh) * 2014-05-21 2014-08-20 中国科学院计算技术研究所 一种可扩展负载均衡系统和方法
CN104901879A (zh) * 2015-07-01 2015-09-09 冯旋宇 路由器的数据发送方法及系统
CN106850822A (zh) * 2017-02-21 2017-06-13 聚好看科技股份有限公司 负载均衡方法、设备及分布式系统
CN107979876A (zh) * 2017-11-16 2018-05-01 广州市百果园网络科技有限公司 数据传输方法及终端
CN108063819A (zh) * 2017-12-18 2018-05-22 迈普通信技术股份有限公司 数据通信方法及装置
CN108600354A (zh) * 2018-04-13 2018-09-28 中国民航信息网络股份有限公司 系统响应时间波动抑制方法和系统
CN110213351A (zh) * 2019-05-17 2019-09-06 北京航空航天大学 一种面向广域高性能计算环境的动态自适应io负载均衡方法
CN111343002A (zh) * 2020-02-10 2020-06-26 腾讯科技(深圳)有限公司 服务器扩容部署的方法、装置及服务器
CN111371603A (zh) * 2020-02-27 2020-07-03 长沙市源本信息科技有限公司 应用于边缘计算的服务实例部署方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072185A (zh) * 2007-06-29 2007-11-14 清华大学 面向服务体系结构soa下优化服务时间的混合策略方法
CN101110841A (zh) * 2007-08-24 2008-01-23 清华大学 面向服务体系结构soa下优化综合指标的混合策略方法
WO2008043391A1 (en) * 2006-10-09 2008-04-17 Telefonaktiebolaget Lm Ericsson (Publ) Load control in a communication network
CN102624922A (zh) * 2012-04-11 2012-08-01 武汉大学 一种网络gis异构集群服务器负载均衡方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008043391A1 (en) * 2006-10-09 2008-04-17 Telefonaktiebolaget Lm Ericsson (Publ) Load control in a communication network
CN101072185A (zh) * 2007-06-29 2007-11-14 清华大学 面向服务体系结构soa下优化服务时间的混合策略方法
CN101110841A (zh) * 2007-08-24 2008-01-23 清华大学 面向服务体系结构soa下优化综合指标的混合策略方法
CN102624922A (zh) * 2012-04-11 2012-08-01 武汉大学 一种网络gis异构集群服务器负载均衡方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957246B (zh) * 2014-04-22 2017-03-01 广州杰赛科技股份有限公司 基于租户感知的动态负载均衡方法及系统
CN103957246A (zh) * 2014-04-22 2014-07-30 广州杰赛科技股份有限公司 基于租户感知的动态负载均衡方法及系统
CN103997526B (zh) * 2014-05-21 2018-05-22 中国科学院计算技术研究所 一种可扩展负载均衡系统和方法
CN103997526A (zh) * 2014-05-21 2014-08-20 中国科学院计算技术研究所 一种可扩展负载均衡系统和方法
CN104901879A (zh) * 2015-07-01 2015-09-09 冯旋宇 路由器的数据发送方法及系统
CN106850822A (zh) * 2017-02-21 2017-06-13 聚好看科技股份有限公司 负载均衡方法、设备及分布式系统
CN106850822B (zh) * 2017-02-21 2020-06-30 聚好看科技股份有限公司 负载均衡方法、设备及分布式系统
CN107979876A (zh) * 2017-11-16 2018-05-01 广州市百果园网络科技有限公司 数据传输方法及终端
CN108063819A (zh) * 2017-12-18 2018-05-22 迈普通信技术股份有限公司 数据通信方法及装置
CN108600354A (zh) * 2018-04-13 2018-09-28 中国民航信息网络股份有限公司 系统响应时间波动抑制方法和系统
CN110213351A (zh) * 2019-05-17 2019-09-06 北京航空航天大学 一种面向广域高性能计算环境的动态自适应io负载均衡方法
CN111343002A (zh) * 2020-02-10 2020-06-26 腾讯科技(深圳)有限公司 服务器扩容部署的方法、装置及服务器
CN111371603A (zh) * 2020-02-27 2020-07-03 长沙市源本信息科技有限公司 应用于边缘计算的服务实例部署方法和装置
CN111371603B (zh) * 2020-02-27 2022-09-13 长沙市源本信息科技有限公司 应用于边缘计算的服务实例部署方法和装置

Also Published As

Publication number Publication date
CN103546542B (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN103546542A (zh) 服务器负载均衡方法和装置
US8812639B2 (en) Job managing device, job managing method and job managing program
US9575691B2 (en) Scheduling user requests in a distributed resource system having a plurality of schedulers and coordinators
US9501318B2 (en) Scheduling and execution of tasks based on resource availability
CN103493449A (zh) 分组交换网络中的有效电路
CN112888005B (zh) 一种面向mec的分布式业务调度方法
CN102859961A (zh) 具有自适应的文件处理的分布式视频转码系统
CN102904961A (zh) 一种云计算资源调度方法及系统
CN111427551A (zh) 编程平台的用户代码运行方法及平台、设备、存储介质
CN109428926B (zh) 一种调度任务节点的方法和装置
Tóth et al. Simulation of finite-source retrial queueing systems with collisions and non-reliable server
CN105786447A (zh) 服务器处理数据的方法、装置及服务器
CN105550025A (zh) 分布式基础设施即服务(IaaS)调度方法及系统
CN111835809B (zh) 工单消息分配方法、装置、服务器及存储介质
CN116192849A (zh) 一种异构加速板卡计算方法、装置、设备及介质
CN109842665B (zh) 用于任务分配服务器的任务处理方法和装置
CN102200928A (zh) 计算资源控制设备和计算资源控制方法
CN106408793B (zh) 一种适用于atm业务的业务组件共享方法及系统
CN114301907A (zh) 云计算网络中的业务处理方法、系统、装置及电子设备
CN104793924A (zh) 计算任务的处理方法及装置
CN114363988A (zh) 分簇方法、装置和电子设备
Choudhury et al. A batch arrival unreliable Bernoulli vacation model with two phases of service and general retrial times
CN106357676A (zh) 一种云服务资源开销优化方法
CN115714774A (zh) 算力请求、算力分配、算力执行方法、终端及网络侧设备
CN109510877B (zh) 一种动态资源群的维护方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220124

Address after: 215488 No. 301, building 11, phase II, Taicang University Science Park, No. 27, Zigang Road, science and education new town, Taicang City, Suzhou City, Jiangsu Province

Patentee after: Tianhang Changying (Jiangsu) Technology Co.,Ltd.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University