CN110933122A - 管理服务器的方法、设备和计算机存储介质 - Google Patents
管理服务器的方法、设备和计算机存储介质 Download PDFInfo
- Publication number
- CN110933122A CN110933122A CN201811102643.1A CN201811102643A CN110933122A CN 110933122 A CN110933122 A CN 110933122A CN 201811102643 A CN201811102643 A CN 201811102643A CN 110933122 A CN110933122 A CN 110933122A
- Authority
- CN
- China
- Prior art keywords
- server
- load level
- threshold
- current load
- user requests
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Computer And Data Communications (AREA)
Abstract
本公开的实施例涉及管理服务器的方法、设备和计算机存储介质。在本公开的一个实施例中,提供了一种方法。该方法包括:获取该服务器中待处理的用户请求的数目;确定针对该待处理的用户请求的数目的第一阈值;基于该待处理的用户请求的数目和该第一阈值,确定该服务器的当前负载水平;以及响应于该当前负载水平超过第二阈值,基于该当前负载水平将该服务器设置为不可用。在本公开的其他实施例中,提供了相应的设备和计算机存储介质。
Description
技术领域
本公开的实施例涉及信息处理领域,并且更具体地,涉及管理服务器的方法、设备和计算机存储介质。
背景技术
随着网络游戏的发展,玩家客户端对游戏服务器或服务器集群的用户请求或其他消息的数目日益增加,导致服务器上的负载增加。当针对某些服务器的用户请求较多,而其他服务器较为空闲时,会出现服务器之间的负载不均衡的现象。负载不均衡可能导致某些服务器上的负载显著超过服务器的处理能力,从而使得服务器崩溃而无法处理用户请求。在此情况下,服务器无法高效地对用户请求进行响应,从而严重降低了用户体验。因此,如何管理服务器以提高系统总体效率成为了一个关注焦点。
发明内容
本公开的实施例提供一种用于管理服务器的方案。
根据本公开的第一方面,提出了一种用于管理服务器的方法。该方法包括:获取该服务器中待处理的用户请求的数目;确定针对该待处理的用户请求的数目的第一阈值;基于该待处理的用户请求的数目和该第一阈值,确定该服务器的当前负载水平;以及响应于该当前负载水平超过第二阈值,基于该当前负载水平将该服务器设置为不可用。
根据本公开的第二方面,提出了一种用于管理服务器的设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作,该动作包括:确定针对该待处理的用户请求的数目的第一阈值;基于该待处理的用户请求的数目和该第一阈值,确定该服务器的当前负载水平;以及响应于该当前负载水平超过第二阈值,基于该当前负载水平将该服务器设置为不可用。
在本公开的第三方面,提供了一种计算机存储介质。该计算机存储介质具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第一方面的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了本公开实施例可以在其中执行的服务器管理系统的架构图;
图2图示了根据本公开实施例的用于管理服务器的方法的流程图;
图3A图示了本公开实施例可以在其中执行的服务器管理系统的具体示例的架构图;
图3B图示了本公开实施例可以在其中执行的服务器管理系统的另一具体示例的架构图;以及
图4图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
图1图示了本公开实施例可以在其中执行的服务器管理系统100的架构图。如图1所示,服务器管理系统100包括客户端110和服务器120。客户端110可以为用户提供本地服务(例如游戏服务),并且向服务器120发送用户请求或消息。客户端110可以包括但不限于移动电话、台式计算机、笔记本计算机、可穿戴设备等。注意,虽然图1中仅示出了一个客户端110,该服务器120可以服务于多个客户端,并且该多个客户端也可以被统称为客户端110。
服务器120可以处理来自客户端110的用户请求或消息,并且作为响应,向客户端110返回针对用户请求或消息的结果。服务器可以包括但不限于大型计算机、工作站、台式计算机、笔记本计算机等。注意,虽然图1中仅示出了一个服务器120,但是服务器120可以是由多个服务器组成的服务器集群。
服务器120可以对服务器120上的负载水平进行监控。在某些实施例中,服务器120上的负载水平可以取决于服务器120上的待处理的用户请求的数目。在此情况下,为了确定负载水平,服务器120可以获取服务器120中待处理的用户请求的数目,并且确定针对待处理的用户请求的数目的预定阈值(也被称为第一阈值)。待处理的用户请求的数目超过第一阈值可以指示服务器120上的待处理的用户请求已经积压。
然后,服务器120可以基于待处理的用户请求的数目和第一阈值,确定服务器120的当前负载水平。在某些实施例中,服务器120还可以获取服务器120的历史负载水平。例如,历史负载水平可以被初始地设置为0。在待处理的用户请求的数目超过第一阈值的情况下,服务器120可以增加历史负载水平以生成当前负载水平。例如,服务器120可以将历史负载水平递增1以生成当前负载水平。
相应地,在待处理的用户请求的数目低于第一阈值的情况下,服务器120可以减少历史负载水平(例如,递减1)以生成当前负载水平。以此方式,使得当前负载水平不仅取决于服务器120上的用户请求的当前积压状况,还取决于服务器120上的用户请求的历史积压状况。
进一步,在某些实施例中,服务器120还可以根据服务器的负载水平,对来自客户端的用户请求进行分流。服务器120可以在当前负载水平超过预定阈值(也被称为第二阈值)的情况下,基于当前负载水平将服务器120设置为不可用。
在此情况下,当服务器120从客户端110接收到针对服务器120的用户请求时,由于服务器120被设置为不可用,因此服务器120可以确定与服务器120相关联的可用服务器的地址,并且向客户端110返回可用服务器的地址。客户端110在接收到可用服务器的地址之后,可以使用该地址与可用服务器建立连接,并且向可以服务器发送用户请求。以此方式,通过将负载水平较高的服务器设置为不可用,并且将用户请求分流到负载水平较低的服务器,实现了服务器之间的负载均衡。
图2图示了根据本公开实施例的管理服务器的方法200的流程图。在210,获取服务器120中待处理的用户请求的数目。在某些实施例中,服务器120可以在预定时间间隔(例如,1秒或其他时间间隔)获取待处理的用户请求的数目。以此方式,服务器120可以按照用户指定的或系统确定的时间间隔,定期获取待处理的用户请求的数目。
在220,服务器120确定针对待处理的用户请求的数目的第一阈值。在某些实施例中,服务器120可以基于服务器120的硬件状态和业务状态确定第一阈值。硬件状态可以指示服务器120的存储资源状态、处理资源状态、输入输出资源状态和服务器120与客户端110之间的连接的数目中的至少一项。此外,业务状态可以指示服务器120上的待处理的用户请求的数目和线程的数目中的至少一项。
例如,服务器120可以通过硬件状态确定服务器120的总资源量,通过业务状态确定服务器120的已使用资源量。然后,服务器120可以通过总资源量和已使用资源量之差确定可用资源量,从而通过可用资源量的大小确定第一阈值。例如,可用资源量可以与第一阈值成正比,使得较大的可用资源量导致较大的第一阈值,而较小的可用资源量导致较小的第一阈值。以此方式,服务器120可以根据服务器120本身所拥有的硬件资源和服务器120上的当前业务水平,来动态地确定用于确定负载水平的适当的第一阈值。
备选地,服务器120可以获取服务器120在预定时间间隔内接收的用户请求的数目(也被称为接收数目),并且获取服务器120在预定时间间隔内完成的用户请求的数目(也被称为完成数目)。然后,服务器120可以基于接收数目和完成数目,确定第一阈值。
例如,第一阈值可以与接收数目与完成数目之比成反比。在此情况下,当接收数目大于完成数目时(比值大于1),服务器120可以确定较小的第一阈值,而当接收数目小于完成数目时(比值小于1),服务器120可以确定较大的第一阈值。以此方式,可以根据服务器接收到用户请求的速度和服务器处理用户请求的速度来动态地确定适当的第一阈值。
在230,服务器120可以基于待处理的用户请求的数目和第一阈值,确定服务器的当前负载水平。在某些实施例中,服务器120可以获取服务器120的历史负载水平。例如,历史负载水平可以被初始地设置为0。然后,在待处理的用户请求的数目超过第一阈值的情况下,服务器120可以增加历史负载水平以生成当前负载水平。例如,服务器120可以将历史负载水平递增1以生成当前负载水平。相应地,在待处理的用户请求的数目低于第一阈值的情况下,服务器120可以减少历史负载水平(例如,递减1)以生成当前负载水平。以此方式,使得当前负载水平不仅取决于服务器120上的用户请求的当前积压状况,还取决于服务器120上的用户请求的历史积压状况。
具体地,假设初始历史负载水平为0,递增幅度为1,第一阈值为数值100,并且预定时间间隔为1秒。在第1秒时,服务器120获取待处理的用户请求的数目为110。由于待处理的用户请求的数目超过第一阈值,服务器120可以通过将历史负载水平0增加1,来确定当前负载水平为1。在第2秒时,服务器120获取待处理的用户请求的数目为90,基于90<100可知,待处理的用户请求的数目低于第一阈值,服务器120可以通过将历史负载水平1(即为第1秒时的当前负载水平)减少1,来确定当前负载水平为0。以此方式,服务器120可以在待处理的用户请求的数目过多时,实现负载水平的增大,而在待处理的用户请求的数目较少时,实现负载水平的减小。
在240,服务器120可以响应于当前负载水平超过第二阈值,基于当前负载水平将服务器120设置为不可用。在某些实施例中,服务器120可以响应于当前负载水平超过第二阈值,确定当前负载水平超过第二阈值的时间戳,并且基于当前负载水平和时间戳将服务器设置为不可用。例如,服务器120可以响应于当前负载水平超过第二阈值,并且时间戳和当前时间之差低于预定阈值(也被称为第三阈值),将服务器120设置为不可用。
例如,假设第二阈值为0,第三阈值为3秒,当前负载水平1,与该当前负载水平相对应的时间戳指示的时间为2018年9月12日20点21分45秒,并且当前时间为2018年9月12日20点21分49秒。在此情况下,当前负载水平1超过第二阈值0,并且时间戳和当前时间之差为4秒。由于时间戳和当前时间之差4秒大于第三阈值3秒,因此服务器120可以认为服务器120的该当前负载水平过时,从而不会将服务器120设置为不可用。以此方式,可以基于负载水平和时间两者来确定服务器的可用性,使得能够仅基于新近确定的负载水平被用于确定服务器的可用性。
此外,在服务器120被设置为不可用的情况下,服务器120还可以响应于从客户端接收到针对服务器120的用户请求,确定与服务器相关联的可用服务器的地址,以及向客户端返回所述可用服务器的地址。以此方式,可以在服务器120的负载水平过大而被设置为不可用的情况下,将用户请求分流到其他可用的服务器。因此,实现了服务器之间的负载均衡,提高了系统的响应速度,从而提高了玩家的游戏体验。
图3A图示了本公开实施例可以在其中执行的服务器管理系统300A的具体示例的架构图。与图1中的服务器管理系统100类似,服务器管理系统300A包括客户端110和服务器120,并且在此省略其描述。与服务器管理系统100的不同之处在于,在服务器管理系统300A中,服务器120包括监控模块310A和分发模块320A。
监控模块310A可以对服务器120上的负载水平进行监控。例如,图2中的动作210-230可以由监控模块310A执行。此外,监控模块310A可以将所监控的负载水平提供给分发模块320A。例如,监控模块310A可以在当前负载水平超过第二阈值(例如,0)的情况下,向分发模块320A发送当前负载水平。
分发模块320A可以根据服务器的负载水平,对来自客户端的用户请求进行分流。例如,图2中的动作240可以由监控模块310A执行。在某些实施例中,分发模块320A可以在所接收的当前负载水平超过第二阈值的情况下,基于当前负载水平将服务器120设置为不可用。
备选地,分发模块320A可以将所接收的当前负载水平与预定阈值(也被称为第四阈值)相比较。在当前负载水平超过第四阈值(例如,2)的情况下,分发模块320A可以将服务器120设置为不可用。通过设置第二阈值和第三阈值,使得可以在当前负载水平超过第二阈值的服务器120(服务器120处于中等压力水平)时,向分发模块320A发出警告,而直到服务器120的当前负载水平超过第四阈值(服务器120处于高压力水平),才使得分发模块320A将服务器120设置为不可用。
在此情况下,当分发模块320A从客户端110接收到针对服务器120的用户请求时,由于服务器120被设置为不可用,因此分发模块320A可以确定与服务器120相关联的可用服务器的地址,并且向客户端110返回可用服务器的地址。客户端110在接收到可用服务器的地址之后,可以使用该地址与可用服务器建立连接,并且向可以服务器发送用户请求。以此方式,通过将负载水平较高的服务器设置为不可用,并且将用户请求分流到负载水平较低的服务器,实现了服务器之间的负载均衡。
注意,虽然图3A中将分发模块320A示出为包括在服务器120中,但是这仅是示意性的。在其他实施例中,分发模块320A可以被实现在服务器120之外。
图3B图示了本公开实施例可以在其中执行的服务器管理系统300B的具体示例的架构图。与图3A中的服务器管理系统300A类似,服务器管理系统300B包括客户端110和服务器120,并且在此省略其描述。与服务器管理系统300A的不同之处在于,在服务器管理系统300B中,服务器120仅包括监控模块310B,而分发模块320B位于服务器120之外。
图3B所示的监控模块310B和分发模块320B的布局与图3A所示的监控模块310A和分发模块320A有所不同。在此实施例中,监控模块310B可以对服务器120上的负载水平进行监控,并且分发模块320B可以根据服务器的负载水平,对来自客户端的用户请求进行分流。例如,图2中的动作210-230可以由监控模块310A执行,并且图2中的动作240可以由监控模块310A执行。以此方式,可以将分发模块320B独立于服务器120实现,使得更容易实现分发模块320B对多个服务器或服务器集群的统一管理。
图4示出了可以用来实施本公开内容的实施例的示例设备400的示意性框图。例如,如图1所示的服务器管理系统100中的服务器120、如图3A所示的服务器管理系统300A中的服务器120(及其中的监控模块310A和分发模块320A)、以及如图3B所示的服务器管理系统300B中的服务器120(及其中的监控模块310A)和分发模块320A可以由设备400来实施。如图所示,设备400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的计算机程序指令或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序指令,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200,可由处理单元401执行。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序被加载到RAM 403并由CPU 401执行时,可以执行上文描述的方法200的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
Claims (17)
1.一种用于管理服务器的方法,包括:
获取所述服务器中待处理的用户请求的数目;
确定针对所述待处理的用户请求的数目的第一阈值;
基于所述待处理的用户请求的数目和所述第一阈值,确定所述服务器的当前负载水平;以及
响应于所述当前负载水平超过第二阈值,基于所述当前负载水平将所述服务器设置为不可用。
2.根据权利要求1所述的方法,其中确定所述第一阈值包括:
基于所述服务器的硬件状态和业务状态确定所述第一阈值,所述硬件状态指示所述服务器的存储资源状态、处理资源状态、输入输出资源状态和所述服务器与客户端之间的连接的数目中的至少一项,所述业务状态指示所述待处理的用户请求的数目和线程的数目中的至少一项。
3.根据权利要求1所述的方法,其中确定所述第一阈值包括:
获取所述服务器在预定时间间隔内接收的用户请求的接收数目;
获取所述服务器在所述预定时间间隔内完成的用户请求的完成数目;以及
基于所述接收数目和所述完成数目,确定所述第一阈值。
4.根据权利要求1所述的方法,其中获取所述待处理的用户请求的数目包括:
以预定时间间隔获取所述待处理的用户请求的数目。
5.根据权利要求4所述的方法,其中确定所述当前负载水平包括:
获取所述服务器的历史负载水平;以及
响应于所述待处理的用户请求的数目超过所述第一阈值,增加所述历史负载水平以生成所述当前负载水平。
6.根据权利要求4所述的方法,其中确定所述当前负载水平包括:
获取所述服务器的历史负载水平;以及
响应于所述待处理的用户请求的数目低于所述第一阈值,减少所述历史负载水平以生成所述当前负载水平。
7.根据权利要求1所述的方法,进一步包括:响应于所述当前负载水平超过第二阈值,确定所述当前负载水平超过所述第二阈值的时间戳;以及
基于所述当前负载水平将所述服务器设置为不可用包括:基于所述当前负载水平和所述时间戳将所述服务器设置为不可用。
8.根据权利要求7所述的方法,其中基于所述当前负载水平和所述时间戳将所述服务器设置为不可用包括:
响应于当前时间与所述时间戳之差低于第三阈值以及所述当前负载水平超过第四阈值,将所述服务器设置为不可用;以及
响应于从客户端接收到针对所述服务器的用户请求,确定与所述服务器相关联的可用服务器的地址;以及
向所述客户端返回所述可用服务器的地址。
9.一种用于管理服务器的设备,包括:
获取所述服务器中待处理的用户请求的数目;
确定针对所述待处理的用户请求的数目的第一阈值;
基于所述待处理的用户请求的数目和所述第一阈值,确定所述服务器的当前负载水平;以及
响应于所述当前负载水平超过第二阈值,基于所述当前负载水平将所述服务器设置为不可用。
10.根据权利要求9所述的设备,其中确定所述第一阈值包括:
基于所述服务器的硬件状态和业务状态确定所述第一阈值,所述硬件状态指示所述服务器的存储资源状态、处理资源状态、输入输出资源状态和所述服务器与客户端之间的连接的数目中的至少一项,所述业务状态指示所述待处理的用户请求的数目和线程的数目中的至少一项。
11.根据权利要求9所述的设备,其中确定所述第一阈值包括:
获取所述服务器在预定时间间隔内接收的用户请求的接收数目;
获取所述服务器在所述预定时间间隔内完成的用户请求的完成数目;以及
基于所述接收数目和所述完成数目,确定所述第一阈值。
12.根据权利要求9所述的设备,其中获取所述待处理的用户请求的数目包括:
以预定时间间隔获取所述待处理的用户请求的数目。
13.根据权利要求12所述的设备,其中确定所述当前负载水平包括:
获取所述服务器的历史负载水平;以及
响应于所述待处理的用户请求的数目超过所述第一阈值,增加所述历史负载水平以生成所述当前负载水平。
14.根据权利要求12所述的设备,其中确定所述当前负载水平包括:
获取所述服务器的历史负载水平;以及
响应于所述待处理的用户请求的数目低于所述第一阈值,减少所述历史负载水平以生成所述当前负载水平。
15.根据权利要求9所述的设备,进一步包括:响应于所述当前负载水平超过第二阈值,确定所述当前负载水平超过所述第二阈值的时间戳;以及
基于所述当前负载水平将所述服务器设置为不可用包括:基于所述当前负载水平和所述时间戳将所述服务器设置为不可用。
16.根据权利要求15所述的设备,其中基于所述当前负载水平和所述时间戳将所述服务器设置为不可用包括:
响应于当前时间与所述时间戳之差低于第三阈值以及所述当前负载水平超过第四阈值,将所述服务器设置为不可用;以及
响应于从客户端接收到针对所述服务器的用户请求,确定与所述服务器相关联的可用服务器的地址;以及
向所述客户端返回所述可用服务器的地址。
17.一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811102643.1A CN110933122B (zh) | 2018-09-20 | 2018-09-20 | 管理服务器的方法、设备和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811102643.1A CN110933122B (zh) | 2018-09-20 | 2018-09-20 | 管理服务器的方法、设备和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110933122A true CN110933122A (zh) | 2020-03-27 |
CN110933122B CN110933122B (zh) | 2023-06-23 |
Family
ID=69855544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811102643.1A Active CN110933122B (zh) | 2018-09-20 | 2018-09-20 | 管理服务器的方法、设备和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110933122B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125066A (zh) * | 2021-01-15 | 2022-03-01 | 北京京东乾石科技有限公司 | 一种处理业务请求的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103369601A (zh) * | 2013-07-15 | 2013-10-23 | 厦门卓讯信息技术有限公司 | 为手机客户端提供大并发处理及流量控制的方法 |
CN104142862A (zh) * | 2013-12-16 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 服务器的过载保护方法及装置 |
CN105847377A (zh) * | 2016-04-12 | 2016-08-10 | 乐视控股(北京)有限公司 | 集群网络的请求拥塞过载处理方法及系统 |
CN106453669A (zh) * | 2016-12-27 | 2017-02-22 | Tcl集团股份有限公司 | 一种负载均衡方法及一种服务器 |
CN106817424A (zh) * | 2017-01-23 | 2017-06-09 | 杭州云纪网络科技有限公司 | 用于控制访问流量的方法及系统 |
US20170264679A1 (en) * | 2016-03-11 | 2017-09-14 | International Business Machines Corporation | Load balancing based on user behavior prediction |
-
2018
- 2018-09-20 CN CN201811102643.1A patent/CN110933122B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103369601A (zh) * | 2013-07-15 | 2013-10-23 | 厦门卓讯信息技术有限公司 | 为手机客户端提供大并发处理及流量控制的方法 |
CN104142862A (zh) * | 2013-12-16 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 服务器的过载保护方法及装置 |
US20170264679A1 (en) * | 2016-03-11 | 2017-09-14 | International Business Machines Corporation | Load balancing based on user behavior prediction |
CN105847377A (zh) * | 2016-04-12 | 2016-08-10 | 乐视控股(北京)有限公司 | 集群网络的请求拥塞过载处理方法及系统 |
CN106453669A (zh) * | 2016-12-27 | 2017-02-22 | Tcl集团股份有限公司 | 一种负载均衡方法及一种服务器 |
CN106817424A (zh) * | 2017-01-23 | 2017-06-09 | 杭州云纪网络科技有限公司 | 用于控制访问流量的方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125066A (zh) * | 2021-01-15 | 2022-03-01 | 北京京东乾石科技有限公司 | 一种处理业务请求的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110933122B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109729040B (zh) | 协议的选择的方法、设备以及计算机可读介质 | |
CN110753112A (zh) | 云服务的弹性伸缩方法和装置 | |
CN110650209A (zh) | 实现负载均衡的方法和装置 | |
CN111200606A (zh) | 深度学习模型任务处理方法、系统、服务器及存储介质 | |
CN109428926B (zh) | 一种调度任务节点的方法和装置 | |
CN113132403A (zh) | 用于内容分发网络的回源方法和装置 | |
WO2022199204A1 (zh) | 用于确定资源的方法和装置 | |
CN112152879B (zh) | 网络质量确定方法、装置、电子设备和可读存储介质 | |
CN110933122B (zh) | 管理服务器的方法、设备和计算机存储介质 | |
CN113742389A (zh) | 一种业务处理方法和装置 | |
CN111580882B (zh) | 应用程序启动方法、装置、计算机系统和介质 | |
CN114090247A (zh) | 用于处理数据的方法、装置、设备以及存储介质 | |
CN114374657A (zh) | 一种数据处理方法和装置 | |
CN114528140A (zh) | 一种业务降级的方法和装置 | |
CN114205414A (zh) | 基于服务网格的数据处理方法、装置、电子设备和介质 | |
CN112769960A (zh) | 一种基于Nginx服务器的主动流量控制方法及系统 | |
CN112163176A (zh) | 数据存储方法、装置、电子设备和计算机可读介质 | |
CN115225094A (zh) | 数据压缩方法、电子设备和计算机程序产品 | |
CN113765871A (zh) | 堡垒机管理的方法和装置 | |
CN113285833B (zh) | 用于获取信息的方法和装置 | |
CN113472565B (zh) | 服务器功能的扩容方法、装置、设备和计算机可读介质 | |
CN116996481B (zh) | 直播数据获取方法、装置、电子设备和存储介质 | |
US11526499B2 (en) | Adaptively updating databases of publish and subscribe systems using optimistic updates | |
CN114745276B (zh) | 交换机带宽调整方法、装置、电子设备和计算机可读介质 | |
CN110262756B (zh) | 用于缓存数据的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |