CN110661824A - 分布式集群中服务器的流量调控方法以及装置 - Google Patents

分布式集群中服务器的流量调控方法以及装置 Download PDF

Info

Publication number
CN110661824A
CN110661824A CN201810687976.9A CN201810687976A CN110661824A CN 110661824 A CN110661824 A CN 110661824A CN 201810687976 A CN201810687976 A CN 201810687976A CN 110661824 A CN110661824 A CN 110661824A
Authority
CN
China
Prior art keywords
read
write
cluster
server
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810687976.9A
Other languages
English (en)
Other versions
CN110661824B (zh
Inventor
付挺
田世坤
程曙光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810687976.9A priority Critical patent/CN110661824B/zh
Publication of CN110661824A publication Critical patent/CN110661824A/zh
Application granted granted Critical
Publication of CN110661824B publication Critical patent/CN110661824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式集群中服务器的流量调控方法以及装置。其中,该方法包括:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。本发明解决了现有技术无法对服务器的流量进行调控的技术问题。

Description

分布式集群中服务器的流量调控方法以及装置
技术领域
本发明涉及流量调控领域,具体而言,涉及一种分布式集群中服务器的流量调控方法以及装置。
背景技术
在云计算环境中,可通过虚拟化技术可将数据中心的计算资源切分为多个虚拟机(Virtual Machine,简称VM),用户在虚拟机中可对应用进行灵活部署,例如,部署WEB、社交、游戏、金融等应用。由于这些应用可能存储着用户的重要数据,因此,用户期望在对数据进行读写时,读写时延能够降低,并且,要求这些应用能够不间断的进行服务,并具有较好的可用性。此外,对于有些应用,用户要求其具有良好的数据可靠性,要求数据具有多个冗余备份,并且单个服务器发生宕机也不会影响应用的使用。基于上述用户的要求,服务器维护人员需要使虚拟机的磁盘接入分布式存储。
在上述过程中,数据中心的内部由集群组成,每个服务器上部署有虚拟化平台、后端存储、业务管理监控系统等系统,这些系统会消耗服务器的资源,例如,CPU、内存、网络等。此外,虚拟机的磁盘在接入后端存储的链路之后,虚拟机的存储链路变长,从而导致服务器上的负载增多,使得用户请求读写的时延变长。为降低读写时延,现有技术采用并发创建虚拟机的方法,通过磁盘快照的方式来实例化恢复出可用的系统磁盘,并将用户的配置信息加载至系统磁盘中,然后在从磁盘快照的实例化出系统磁盘的过程中,可能会产品大量的读写流量,因此,在批量并发创建虚拟机的过程中,可能会对数据中心造成较大的读写压力的冲击,由此,需要对集群级别的读写流量进行调控。
针对上述问题,现有的流量调控方案存在如下缺陷:
(1)在大规模分布式集群中,批量使用磁盘快照来恢复创建出的用户可使用的磁盘时,会对底层存储集群造成较大读写压力,对整个管理集群的分布式系统造成了较大的压力冲击,使得整个集群对外表现服务能力不稳定,严重时可能使得整个集群不可用。
(2)多个用户同时批量创建大规模的虚拟机,对集群造成的大规模冲击可反映在每个服务器上,用户持续不断的进行读写操作可能导致服务器网卡损坏,使得服务器的负载过高,磁盘读写流量变大,进而影响单个服务器上的所有系统软件应用,进而影响单个服务器上服务的存量磁盘的读写。例如,当大量用户同时访问微博时,需要在短时间内创建大量的虚拟机,对大量虚拟机的读写操作使得集群内的服务器的写流量压力过大,从而使得系统软件应用产生故障,甚至不可用。
(3)为保障用户的SLA(Service-Level Agreement,服务质量保障),不仅需要保证新用户创建虚拟机过程的SLA,也要保证存量老用户虚拟机读写的SLA。由于单个服务器上的磁盘、网络、CPU等资源有限,因此,在通过系统盘快照的方式创建出用户虚拟机的过程中会产生大量的读写流量,并与单个服务器上的其他虚拟机争夺资源。
针对上述现有技术无法对服务器的流量进行调控的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种分布式集群中服务器的流量调控方法以及装置,以至少解决现有技术无法对服务器的流量进行调控的技术问题。
根据本发明实施例的一个方面,提供了一种分布式集群中服务器的流量调控方法,包括:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
根据本发明实施例的另一方面,还提供了一种分布式集群中主控服务器的流量调控方法,包括:接收分布式集群下多个集群服务器分别上报的统计结果,其中,统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态。
根据本发明实施例的另一方面,还提供了一种分布式集群中集群服务器的流量调控方法,包括:接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,其中,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果;将统计结果上报至主控服务器,其中,主控服务器负责管控分布式集群下的多个集群服务器,统计结果供主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
根据本发明实施例的另一方面,还提供了一种分布式集群中服务器的流量调控装置,包括:统计模块,用于对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;控制模块,用于根据流量统计数据对读写任务进行流量控制。
根据本发明实施例的另一方面,还提供了一种分布式集群中主控服务器的流量调控装置,包括:接收模块,用于接收分布式集群下多个集群服务器分别上报的统计结果,其中,统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;确定模块,用于根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态。
根据本发明实施例的另一方面,还提供了一种分布式集群中集群服务器的流量调控装置,包括:接收模块,用于接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,其中,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;统计模块,用于对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果;处理模块,用于将统计结果上报至主控服务器,其中,主控服务器负责管控分布式集群下的多个集群服务器,统计结果供主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行如下步骤:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
根据本发明实施例的另一方面,还提供了一种计算机设备,包括:处理器,其中,处理器用于运行程序,其中,程序运行时执行如下步骤:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
根据本发明实施例的另一方面,还提供了一种流量调控系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
在本发明实施例中,采用统计服务器在不同存储区域内的流量的方式,通过对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,并根据流量统计数据对读写任务进行流量控制,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据,达到了对服务器的流量进行调控的目的,从而实现了提高服务器运行的稳定性以及可靠性的技术效果,进而解决了现有技术无法对服务器的流量进行调控的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的服务器的流控调整结构示意图;
图2是根据本发明实施例的一种分布式集群中服务器的流量调控方法的流程图;
图3是根据本发明实施例的一种分布式集群中主控服务器的流量调控方法的流程图;
图4是根据本发明实施例的一种可选的主控服务器的流量调控系统结构示意图;
图5是根据本发明实施例的一种分布式集群中集群服务器的流量调控方法的流程图;
图6是根据本发明实施例的一种可选的流控调整示意图;
图7是根据本发明实施例的一种分布式集群中服务器的流量调控装置的结构示意图;
图8是根据本发明实施例的一种分布式集群中主控服务器的流量调控装置的结构示意图;
图9是根据本发明实施例的一种分布式集群中集群服务器的流量调控装置的结构示意图;以及
图10是根据本发明实施例的一种计算机设备的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,还提供了一种分布式集群中服务器的流量调控方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
此外,还需要说明的是,为解决集群级别的读写流量进行调控,目前可通过如下方法来实现用户磁盘级别的读写服务质量的调控。具体的,首先,服务器在接收到读/写操作指令后,从令牌桶中申请令牌,其中,令牌桶包括读写操作令牌桶和带宽令牌桶。然后,判断读写操作令牌桶和带宽令牌桶中是否存在令牌,如果读写操作令牌桶和带宽令牌桶中存在令牌,则从读写操作令牌桶和带宽令牌桶获得令牌,并将获得的令牌从读写操作令牌桶和带宽令牌桶中去除。如果读写操作令牌桶和带宽令牌桶中不存在令牌,则获取与读写操作指令对应的存储块的卷属性,并从卷属性中获取向读写操作令牌桶和带宽令牌桶中添加令牌的速度,然后根据读写操作令牌桶和带宽令牌桶中添加令牌的速度,按照预设规则更新读写操作令牌桶和带宽令牌桶,并从更新后的读写操作令牌桶和带宽令牌桶中获取令牌。在此之后,判断从读写操作令牌桶和带宽令牌桶中是否都可申请到令牌,如果从读写操作令牌和带宽令牌桶中都能够申请到令牌,则执行与读写操作指令对应的操作。
由上述内容可知,上述方案并没有实现单个物理服务器的读写流量调控,并且,存在多个用户同时产生大规模读写流量导致服务器宕机的问题。此外,上述方案也没有考虑到全集群服务器下的读写流量调控,也未解决全集群服务器通过快照技术恢复磁盘所带来的流量冲击问题。
为解决上述问题,本实施例提供了一种分布式集群中服务器的流量调控方法,其中,图1示出了的服务器的流控调整结构示意图。图1中的流控模块可对位于服务器上的多个虚拟机的流量进行调控,例如,当服务器中的某一个虚拟机的读写流量达到设定的流量上限时,流控模块对其进行流量调控,以保护服务器的资源不被耗尽,其中,流控模块为服务器中的一个运行模块,其包括三个子模块,即计数器、调度单元以及计时器,每个子模块具有对应的控制逻辑。
基于图1所示的服务器的流控调整结构示意图,本申请提供了如图2所示的分布式集群中服务器的流量调控方法。图2是根据本发明实施例一的分布式集群中服务器的流量调控方法的流程图。
步骤S202,对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据。
在上述步骤S202中,第一存储区域可以为但不限于分布式文件存储系统,该系统内包含多个存储区域,即第一存储区域包含多个子存储区域,每个子存储区域与一个虚拟机相对应,用于存储与其对应的虚拟机的数据。上述第二存储区域存储的数据为对第一存储区域内进行备份后的数据,即上述根据磁盘快照数据实例化恢复出的数据,其中,第二存储区域也可以包括多个子存储区域,分别与第一区域中的子存储区域相对应。另外,第二存储区域也可仅包含一个子存储区域,即第二存储区域仅存储需要进行备份的数据。可选的,当第一存储区域内的部分子存储区域内需要备份时,第二存储区域的子存储区域的数量可根据需要进行备份的第一存储区域的子存储区域的数量进行调整。
需要说明的是,磁盘快照数据是指磁盘在某一时刻(例如,步骤S202中的预设时刻)的静止数据状态。
在一种可选的方案中,服务器上的流控模块可对虚拟机在第一存储区域与第二存储区域之间的读写任务进行流量统计,其中,每个服务器可具有至少一个流控模块。可选的,多个用户通过虚拟机上的微博应用,发表微博,此时,虚拟机可获取到用户写入的数据,并将其存储到第一存储区域。流控模块检测到有新的数据存储至第一存储区域,同时将存储到第一存储区域内的数据写入至第二存储区域进行备份。此外,流控模块统计从第一存储区域写入第二存储区域的数据流量进行统计。当用户通过虚拟机上的微博应用查看已经发表的微博时,流控模块控制第一存储区域从第二存储区域内读取已发表微博的备份数据,并将该备份数据传送至虚拟机,以使用户查看相应的微博。在上述过程中,流控模块统计从第二存储区域写入第一存储区域的数据流量。
步骤S204,根据流量统计数据对读写任务进行流量控制。
在步骤S204中,流控模块可根据从第一存储区域写入第二存储区域的数据流量以及从第二存储区域写入第一存储区域的数据流量,进行流量控制,以保证服务器上的流量平衡和稳定,进而保证了服务器的服务能力的稳定。
基于上述步骤S202至步骤S204所限定的方案,可以获知,通过对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,并根据流量统计数据对读写任务进行流量控制,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据。
容易注意到的是,由于在服务器中设置流控模块,并且,每个服务器具有至少一个流控模块,该流控模块可对服务器中虚拟机的读写流量进行控制,因此,达到了对服务器的流量进行调控的目的,从而实现了提高服务器运行的稳定性以及可靠性的技术效果。
由此可见,本申请所提供的分布式集群中服务器的流量调控方法可以解决现有技术无法对服务器的流量进行调控的技术问题。
在一种可选的方案中,流控模块至少基于读写请求个数和读写请求字节数对虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,得到流量统计数据。其中,读写请求个数是指每秒钟虚拟机的读写请求个数,单位为iops(Input/OutputOperations Per Second);读写请求字节数是指每秒钟虚拟机的读写请求的字节数,单位为bps(Bytes Per Second)。
需要说明的是,流控模块可以从读写请求个数和读写请求字节数两个方面对虚拟机的读写任务进行流量统计,进一步,流控模块也可从读写请求个数和读写请求字节数两个方面对读写任务进行流量控制,具体步骤如下:
步骤S2040,根据时间片内的当前时间戳和时间片对应的处理能力上限确定允许处理的读写请求个数或读写请求字节数;
步骤S2042,根据流量统计数据中在时间片已处理的读写请求个数和读写请求字节数确定期望处理的读写请求个数或读写请求字节数;
步骤S2044,根据允许处理的读写请求个数或读写请求字节数与期望处理的读写请求个数或读写请求字节数的比较结果对读写任务进行流量控制。
需要说明的是,流控模块中的计数器可对时间片进行管理,并统计时间片内的读写请求个数或读写请求字节数,其中,时间片的长度可根据实际情况进行设置,例如,将其设置为200ms。
具体的,以读写请求个数为例进行说明,其中,对于读写请求字节数也同样适用,在此不再赘述。计数器通过当前时间戳和对应上限设置计算当前时间戳所允许的读写请求个数,并记为allow。然后再通过时间片机内已经处理过的读写请求字节数、读写请求个数以及当前时间戳对应的读写请求个数,计算期望处理的读写请求个数,并记为expect。最后根据expect与allow的大小关系来对读写任务进行流量控制。
在一种可选的方案中,如果期望处理的读写请求个数小于或等于允许处理的读写请求个数以及期望处理的读写请求字节数小于或等于允许处理的读写请求字节数,则立即执行读写任务;如果期望处理的读写请求个数大于允许处理的读写请求个数或者期望处理的读写请求字节数大于允许处理的读写请求字节数,则延迟执行读写任务。
具体的,如果expect<=allow,则设置延迟时间wait为0,此时,流控模块立即执行读写任务;如果expect>allow,则延迟时间wait不为0,流控模块需要在延迟时间之后,才能执行读写任务。
进一步地,流控没模块在第一存储区域与第二存储区域之间延迟执行读写任务包括:
步骤S2060,采用期望处理的读写请求个数与允许处理的读写请求个数的差值再除以时间片对应的处理能力上限得到第一等待时长;
步骤S2062,采用期望处理的读写请求字节数与允许处理的读写请求字节数的差值再除以时间片对应的处理能力上限得到第二等待时长;
步骤S2064,从第一等待时长与第二等待时长中选取较大等待时长;
步骤S2066,将期望处理的读写请求个数放入第一等待队列以及将期望处理的读写请求字节数放入第二等待队列,并在经历较大等待时长之后,触发执行在第一等待队列和第二等待队列的读写任务。
需要说明的是,读写请求个数和读写请求字节数各对应一个延迟时间wait,延迟时间满足下式:
Figure BDA0001712167350000091
在上式中,s为时间片对应的处理能力上限,其中,读写请求个数对应的延迟时间为第一等待时长,此时,expect为期望处理的读写请求个数,allow为允许处理的读写请求个数;读写请求字节数对应的延迟时间为第二等待时长,此时,expect为期望处理的读写请求字节数,allow为允许处理的读写请求字节数。
如果第一等待时长和第二等待时长均为0,则流控模块直接执行读写任务,并由相应的提交函数将读写任务提交至下一级的存储系统中,其中,在提交读写任务之前,流控模块对计数器内的时间片、读写请求个数或读写请求字节数进行更新。如果第一等待时长或第二等待时长至少一个不为0,则计数器确定两个等待时长中较大的等待时长,此时,计时器将在较大的等待时长之后,触发调度单元从第一等待队列或第二等待队列中取出读写数据。
在一种可选的方案中,在触发执行在第一等待队列和第二等待队列的读写任务之后,流控模块对读写认为进行调度,其中,该方法可以包括:
步骤S2080,按照先入先出原则对第一等待队列内放入的期望处理的读写请求个数重新计算第一等待时长以及对第二等待队列内放入的期望处理的读写请求字节数重新计算第二等待时长;
步骤S2082,如果重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列;
步骤S2084,对临时队列内等待处理的读写任务进行处理。
具体的,流控模块的调度单元按照先入先出原则从两个等待队列中取出读写请求个数,并通过计数器分别再次每个等待队列的等待时长,并根据等待时长来确定是否执行对应的读写任务。如果两个等待时长均为0,即重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列,直至重新计算的第一等待时长与重新计算的第二等待时长中的至少一个等待时长不为0。在确定两个等待时长中至少一个等待时长不为0之后,调度单元按照请求读写请求的标识(例如,读写请求对应的时间戳)的大小,按照从小到大的顺序对临时队列中的读写任务进行排序,以保证对读写任务的处理顺序与原始顺序相同。最后,调度单元将读写任务批量提交至下一级的存储系统中。另外,在提交读写任务之前,流控模块对计数器内的时间片、读写请求个数或读写请求字节数进行更新。
需要说明的是,如果等待时长不为-1,则等待队列中还存在读写任务,此时,计时器在等待时长时间之后,再次触发调度单元从等待队列中获取读写任务;如果等待时长为-1,则等待队列中已无读写任务,只有在读写任务加入等待队列之后,才会触发调度单元从等待队列中获取读写任务。其中,等待队列为上述第一等待队列和/或第二等待队列。
另外,由上述内容可知,计时器主要负责定时触发调度单元执行时长超过等待时长的读写任务。计时器包括执行任务的线程池、维护等待时长与读写任务对应关系的优先级队列以及管理优先级队列的背景线程。另外,计时器在接收到相对等待时长以及当前时间对应的读写任务之后,将相对等待时长转换为绝对时间,并将绝对时间放入优先级队列中。按绝对时间的先后将绝对时间插入到优先级队列中,并保持绝对时间最早的元素在优先级队列的顶部。此外,计时器还可维护绝对时间与读写任务的映射关系,并由计时器内部的另外一个线程在后台循环取出优先级队列的顶部元素,如果顶部元素的绝对时间已过期,则释放顶部元素,并由线程池进行处理。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的分布式集群中服务器的流量调控方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了如图3所示的分布式集群中主控服务器的流量调控方法,由图3所示,该方法包括:
步骤S302,接收分布式集群下多个集群服务器分别上报的统计结果,其中,统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到。
在上述步骤S302中,主控服务器可接收分布式集群下多个集群系统服务器上报的统计结果,即主控服务器可管理多个集群,如图4所示的主控服务器的流量调控系统结构示意图,其中,每个集群由集群服务器管理,每个集群中的物理机即为上述服务器,每个服务器中具有至少一个实施例1中的流控模块,该流控模块可对流量统计数据进行控制,还可统计当前正在执行读写任务的虚拟机的数量。需要说明的是,上述第一存储区域可以为但不限于分布式文件存储系统,该存储区域包括多个子存储区域,每个子存储区域与一个虚拟机相对应,用于存储与其对应的虚拟机的数据;第二存储区域也可包含多个子存储区域,分别与第一存储区域内的子存储区域相对应。
在一种可选的方案中,如图4所示,每个服务器将流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量上报至集群服务器,集群服务器对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果,然后将统计结果发送至主控服务器,主控服务器接收集群服务器上报的统计结果。
步骤S304,根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态。
在一种可选的方案中,主控服务器根据统计结果确定某些集群服务器的读写流量持续升高,并接近流量阈值,则主控服务器确定该集群服务器为临时停止服务状态。其中,处于临时停止服务状态下的集群服务器无法响应用户创建虚拟机的请求,但当该集群服务器由临时停止服务状态进入到可服务状态之后,即可响应用户创建虚拟机的请求。
基于上述步骤S302至步骤S304所限定的方案,可以获知,通过接收分布式集群下多个集群服务器分别上报的统计结果,并根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态,其中,统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到。
容易注意到的是,由于在服务器中设置流控模块,并且,每个服务器具有至少一个流控模块,该流控模块可对服务器中虚拟机的读写流量进行控制,因此,达到了对服务器的流量进行调控的目的,从而实现了提高服务器运行的稳定性以及可靠性的技术效果。
由此可见,本申请所提供的分布式集群中主控服务器的流量调控方法可以解决现有技术无法对服务器的流量进行调控的技术问题。此外,主控服务器通过集群服务器所上报的统计结果来确定集群服务器的服务状态,达到了对集群服务器的流量的调整,进而保证了集群服务器进行服务的稳定性。
在一种可选的方案中,主控服务器可根据集群服务器的流量负载来确定部分集群服务器进入临时停止服务状态,其中,上述方法可以包括:
步骤S3040,根据每个集群服务器分别上报的统计结果确定每个集群服务器的流量负载;
步骤S3042,从多个集群服务器中选取流量负载超过预设流量范围的集群服务器,确定为部分集群服务器;
步骤S3044,将部分集群服务器设置为临时停止服务状态,并停止向部分集群服务器分配新的虚拟机创建请求。
需要说明的是,主控服务器在确定集群服务器的流量负载超过预设流量范围之后,将该集群服务器设置为临时停止服务状态,在该状态下,集群服务器不会响应用户创建虚拟机的请求。为保证单个集群服务器的稳定性良好,在根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态之后,如果主控服务器根据部分集群服务器在后续上报周期内上报的统计结果确定部分集群服务器的流量负载恢复至预设流量范围内,则将部分集群服务器设置为可服务状态,并重新向部分集群服务器分配新的虚拟机创建请求。
进一步地,在根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态之后,主控服务器在接收到新的虚拟机创建请求之后,根据多个集群服务器中除部分集群服务器之外剩余的集群服务器上当前执行数据恢复任务所产生的读写流量以及参与执行数据恢复任务的虚拟机数量,分配新的虚拟机创建请求。具体的,在接收到用户虚拟机创建请求之后,主控服务器会根据当前服务器集群内的恢复任务所产生的读写流量以及正在执行数据恢复任务的虚拟机的数量来进行调度,以使主控服务器所调度的整个系统内的集群服务器能够负载均衡。
需要说明的是,在保证新用户创建虚拟机的过程的读写质量的同时,也需要保障老用户进行读写的读写质量,为避免新用户和老用户争抢资源,本实施例还提供了一种虚拟机的读写质量保障方法。其中,根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态包括:
步骤S3060,根据每个集群服务器分别上报的统计结果确定每个集群服务器的当前正在执行读写任务中数据恢复任务的虚拟机的数量;
步骤S3062,从多个集群服务器中选取同一集群服务器下每个服务器当前正在执行数据恢复任务的虚拟机的数量均超过预设阈值的集群服务器,确定为部分集群服务器;
步骤S3064,将部分集群服务器设置为临时停止服务状态,并停止向部分集群服务器分配新的虚拟机创建请求。
在一种可选的方案中,如果集群服务器A中所有的服务器上的虚拟机的数量均超过预设阈值(例如,3台),则将集群服务器A设置为临时停止服务状态。可选的,如果集群服务器B中所有服务器上的虚拟机的登录时间均大于预设时间(例如,180s),则集群服务器B设置为临时停止服务状态。
进一步地,在根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态之后,如果确定部分集群服务器下各个服务器当前正在执行数据恢复任务已经执行完毕,则将部分集群服务器设置为可服务状态,并重新向部分集群服务器分配新的虚拟机创建请求。
实施例3
根据本发明实施例,还提供了一种分布式集群中集群服务器的流量调控方法,如图5所示,该方法包括:
步骤S502,接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,其中,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到。
需要说明的是,集群服务器可接收当前集群内多个服务器上传的流量统计数据以及执行读写任务的虚拟机的数量,其中,每个服务器中具有至少一个实施例1中的流控模块,该流控模块可对流量统计数据进行控制,还可统计当前正在执行读写任务的虚拟机的数量。另外,上述第一存储区域可以为但不限于分布式文件存储系统,该存储区域包括多个子存储区域,每个子存储区域与一个虚拟机相对应,用于存储与其对应的虚拟机的数据;第二存储区域也可包含多个子存储区域,分别与第一存储区域内的子存储区域相对应。
步骤S504,对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果。
在一种可选的方案中,如图4所示,每个服务器将流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量上报至集群服务器,集群服务器对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果,然后将统计结果发送至主控服务器。
步骤S506,将统计结果上报至主控服务器,其中,主控服务器负责管控分布式集群下的多个集群服务器,统计结果供主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
在一种可选的方案中,集群服务器在得到统计结果之后,将统计结果上报至主控服务器。主控服务器接收集群服务器上报的统计结果,并根据统计结果确定某些集群服务器的读写流量持续升高,并接近流量阈值,则主控服务器确定该集群服务器为临时停止服务状态。其中,处于临时停止服务状态下的集群服务器无法响应用户创建虚拟机的请求,但当该集群服务器由临时停止服务状态进入到可服务状态之后,即可响应用户创建虚拟机的请求。
基于上述步骤S502至步骤S506所限定的方案,可以获知,通过接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,然后对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果,并将统计结果上报至主控服务器,其中,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到,主控服务器负责管控分布式集群下的多个集群服务器,统计结果供主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
容易注意到的是,由于在服务器中设置流控模块,并且,每个服务器具有至少一个流控模块,该流控模块可对服务器中虚拟机的读写流量进行控制,因此,达到了对服务器的流量进行调控的目的,从而实现了提高服务器运行的稳定性以及可靠性的技术效果。
由此可见,本申请所提供的分布式集群中集群服务器的流量调控方法可以解决现有技术无法对服务器的流量进行调控的技术问题。此外,主控服务器通过集群服务器所上报的统计结果来确定集群服务器的服务状态,达到了对集群服务器的流量的调整,进而保证了集群服务器进行服务的稳定性。
在一种可选的方案中,在对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果之后,如果根据统计结果确定读写任务的性能参数超过第一预设阈值,则根据当前集群内正在执行读写任务的虚拟机的数量重新分配处理读写任务的资源;如果根据统计结果确定读写任务的性能参数低于第二预设阈值,则根据当前已经分配的处理读写任务的资源重新设置性能参数的上限值,其中,性能参数为以下之一:当前集群内数据快照任务对应的读写请求字节数总和、当前集群内数据快照任务对应的读写请求个数总和、当前集群内数据恢复任务对应的读写请求字节数总和、当前集群内数据恢复任务对应的读写请求个数总和。
需要说明的是,在上述过程中,相邻两次重新分配处理读写任务的资源或重新设置性能参数的上限值之间的时间间隔大于第三预设阈值,例如,30秒。
具体的,集群服务器检测集群内所有服务器的当前集群内数据快照任务对应的读写请求字节数总和snapshot_qps、当前集群内数据快照任务对应的读写请求个数总和snapshot_bps、当前集群内数据恢复任务对应的读写请求字节数总和lazyload_qps以及当前集群内数据恢复任务对应的读写请求个数总和lazyload_bps。然后检测性能参数与预设阈值(即第一预设阈值和第二预设阈值)的大小,其中,如果性能参数中的任意一个参数超过了第一预设阈值,例如,集群服务器中负载量的70%,并且,没有为该集群服务器内的服务器分配读写任务,则集群服务器根据服务器中正在执行读写任务的虚拟机的数量分配读写任务。如果性能参数中的任意一个参数低于第二预设阈值,例如,集群服务器中负载量的60%,并且,已经为该集群服务器内的服务器分配读写任务,则集群服务器根据已经分配的读写任务的读写请求个数以及读写请求字节数重新设置性能参数的上限值。另外,如果集群服务器还检测到集群内所有服务器的snapshot_qps、snapshot_bps、lazyload_qps以及lazyload_bps是否需要重新分配,例如,调整后的性能参数仍大于第一预设阈值,但某些服务器上的正在执行读写任务的虚拟机的数量增加或者减少,则根据虚拟机的数量重新分配读写任务的资源。
在一种优选的实施例中,如图6所示的流控调整示意图。具体的,首先,服务器将上报流量统计数据至集群服务器,集群服务器对其所管理的所有服务器上报的流量统计数进行汇总,并根据流量统计数据确定读写任务的性能参数是否满足预设条件,例如,确定读写任务的性能参数是否超过第一预设阈值,和/或确定读写任务的性能参数是否低于第二预设阈值。如果性能参数满足预设条件,则集群服务器根据当前集群内正在执行读写任务的虚拟机的数量重新分配处理读写任务的资源。然后检测本次调整与上次调整的调整时间间隔是否大于预设间隔,如果调整时间间隔大于预设间隔,则重新分配处理读写任务的资源。另外,如果性能参数不满足预设条件,则检测服务器的读写任务的资源是否被调整过,如果被调整过,则恢复性能参数的上限值;如果未被调整过,则结束流程。
实施例4
根据本发明实施例,还提供了一种用于实施上述分布式集群中服务器的流量调控方法的分布式集群中服务器的流量调控装置,如图7所示,该装置包括:统计模块701以及控制模块703。
其中,统计模块701,用于对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;控制模块703,用于根据流量统计数据对读写任务进行流量控制。
此处,需要说明的是,上述统计模块701以及控制模块703对应于实施例1中的步骤S202至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
在一种可选的方案中,统计模块包括:第一统计模块。其中,第一统计模块,用于从读写请求个数和读写请求字节数上对虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,得到流量统计数据。
在一种可选的方案中,控制模块包括:第一确定模块、第二确定模块以及第一控制模块。其中,第一确定模块,用于根据时间片内的当前时间戳和时间片对应的处理能力上限确定允许处理的读写请求个数或读写请求字节数;第二确定模块,用于根据流量统计数据中在时间片已处理的读写请求个数和读写请求字节数确定期望处理的读写请求个数或读写请求字节数;第一控制模块,用于根据允许处理的读写请求个数或读写请求字节数与期望处理的读写请求个数或读写请求字节数的比较结果对读写任务进行流量控制。
此处,需要说明的是,上述第一确定模块、第二确定模块以及第一控制模块对应于实施例1中的步骤S2040至步骤S2044,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
在一种可选的方案中,第一控制模块包括:第一执行模块以及第二执行模块。其中,第一执行模块,用于如果期望处理的读写请求个数小于或等于允许处理的读写请求个数以及期望处理的读写请求字节数小于或等于允许处理的读写请求字节数,则立即执行读写任务;第二执行模块,用于如果期望处理的读写请求个数大于允许处理的读写请求个数或者期望处理的读写请求字节数大于允许处理的读写请求字节数,则延迟执行读写任务。
在一种可选的方案中,第二执行模块包括:第一处理模块、第二处理模块、第三处理模块以及触发模块。其中,第一处理模块,用于采用期望处理的读写请求个数与允许处理的读写请求个数的差值再除以时间片对应的处理能力上限得到第一等待时长;第二处理模块,用于采用期望处理的读写请求字节数与允许处理的读写请求字节数的差值再除以时间片对应的处理能力上限得到第二等待时长;第三处理模块,用于从第一等待时长与第二等待时长中选取较大等待时长;触发模块,用于将期望处理的读写请求个数放入第一等待队列以及将期望处理的读写请求字节数放入第二等待队列,并在经历较大等待时长之后,触发执行在第一等待队列和第二等待队列的读写任务。
此处,需要说明的是,上述第一处理模块、第二处理模块、第三处理模块以及触发模块对应于实施例1中的步骤S2060至步骤S2066,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
在一种可选的方案中,分布式集群中服务器的流量调控装置还包括:第四处理模块、第五处理模块以及第六处理模块。其中,第四处理模块,用于按照先入先出原则对第一等待队列内放入的期望处理的读写请求个数重新计算第一等待时长以及对第二等待队列内放入的期望处理的读写请求字节数重新计算第二等待时长;第五处理模块,用于如果重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列;第六处理模块,用于对临时队列内等待处理的读写任务进行处理。
此处,需要说明的是,上述第四处理模块、第五处理模块以及第六处理模块对应于实施例1中的步骤S2080至步骤S2084,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
实施例5
根据本发明实施例,还提供了一种用于实施上述分布式集群中主控服务器的流量调控方法的分布式集群中主控服务器的流量调控装置,如图8所示,该装置包括:接收模块801以及确定模块803。
其中,接收模块801,用于接收分布式集群下多个集群服务器分别上报的统计结果,其中,统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;确定模块803,用于根据统计结果从多个集群服务器中确定部分集群服务器进入临时停止服务状态。
此处,需要说明的是,上述接收模块801以及确定模块803对应于实施例2中的步骤S302至步骤S304,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例二所公开的内容。
在一种可选的方案中,确定模块包括:第一确定模块、第二确定模块以及第一分配模块。其中,第一确定模块,用于根据每个集群服务器分别上报的统计结果确定每个集群服务器的流量负载;第二确定模块,用于从多个集群服务器中选取流量负载超过预设流量范围的集群服务器,确定为部分集群服务器;第一分配模块,用于将部分集群服务器设置为临时停止服务状态,并停止向部分集群服务器分配新的虚拟机创建请求。
此处,需要说明的是,上述第一确定模块、第二确定模块以及第一分配模块对应于实施例2中的步骤S3040至步骤S3044,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例二所公开的内容。
在一种可选的方案中,分布式集群中主控服务器的流量调控装置还包括:第三确定模块。其中,第三确定模块,用于如果根据部分集群服务器在后续上报周期内上报的统计结果确定部分集群服务器的流量负载恢复至预设流量范围内,则将部分集群服务器设置为可服务状态,并重新向部分集群服务器分配新的虚拟机创建请求。
在一种可选的方案中,分布式集群中主控服务器的流量调控装置还包括:第二分配模块。其中,第二分配模块,用于在接收到新的虚拟机创建请求之后,根据多个集群服务器中除部分集群服务器之外剩余的集群服务器上当前执行数据恢复任务所产生的读写流量以及参与执行数据恢复任务的虚拟机数量,分配新的虚拟机创建请求。
在一种可选的方案中,确定模块包括:第四确定模块、第五确定模块以及处理模块。其中,第四确定模块,用于根据每个集群服务器分别上报的统计结果确定每个集群服务器的当前正在执行读写任务中数据恢复任务的虚拟机的数量;第五确定模块,用于从多个集群服务器中选取同一集群服务器下每个服务器当前正在执行数据恢复任务的虚拟机的数量均超过预设阈值的集群服务器,确定为部分集群服务器;处理模块,用于将部分集群服务器设置为临时停止服务状态,并停止向部分集群服务器分配新的虚拟机创建请求。
此处,需要说明的是,上述第四确定模块、第五确定模块以及处理模块对应于实施例2中的步骤S3060至步骤S3064,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例二所公开的内容。
在一种可选的方案中,分布式集群中主控服务器的流量调控装置还包括:第三分配模块。其中,第三分配模块,用于如果确定部分集群服务器下各个服务器当前正在执行数据恢复任务已经执行完毕,则将部分集群服务器设置为可服务状态,并重新向部分集群服务器分配新的虚拟机创建请求。
实施例6
根据本发明实施例,还提供了一种用于实施上述分布式集群中集群服务器的流量调控方法的分布式集群中集群服务器的流量调控装置,如图9所示,该装置包括:接收模块901、统计模块903以及处理模块905。
其中,接收模块901,用于接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,其中,流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;统计模块903,用于对多个服务器分别上报的流量统计数据以及当前正在执行读写任务的虚拟机的数量进行统计,得到统计结果;处理模块905,用于将统计结果上报至主控服务器,其中,主控服务器负责管控分布式集群下的多个集群服务器,统计结果供主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
此处,需要说明的是,上述接收模块901、统计模块903以及处理模块905对应于实施例3中的步骤S502至步骤S506,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例三所公开的内容。
在一种可选的实施例中,分布式集群中集群服务器的流量调控装置还包括:第一分配模块以及第二分配模块。其中,第一分配模块,用于如果根据统计结果确定读写任务的性能参数超过第一预设阈值,则根据当前集群内正在执行读写任务的虚拟机的数量重新分配处理读写任务的资源;第二分配模块,如果根据统计结果确定读写任务的性能参数低于第二预设阈值,则根据当前已经分配的处理读写任务的资源重新设置性能参数的上限值,其中,性能参数为以下之一:当前集群内数据快照任务对应的读写请求字节数总和、当前集群内数据快照任务对应的读写请求个数总和、当前集群内数据恢复任务对应的读写请求字节数总和、当前集群内数据恢复任务对应的读写请求个数总和。
在一种可选的实施例中,相邻两次重新分配处理读写任务的资源或重新设置性能参数的上限值之间的时间间隔大于第三预设阈值。
实施例7
根据本发明实施例,还提供了一种流量调控系统,该系统可执行实施例1至3的流控控制方法,其中,该系统包括:处理器和存储器。
其中,存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
需要说明的是,服务器上的流控模块可对虚拟机在第一存储区域与第二存储区域之间的读写任务进行流量统计,其中,每个服务器可具有至少一个流控模块。
由上可知,通过对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,并根据流量统计数据对读写任务进行流量控制,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据。
容易注意到的是,由于在服务器中设置流控模块,并且,每个服务器具有至少一个流控模块,该流控模块可对服务器中虚拟机的读写流量进行控制,因此,达到了对服务器的流量进行调控的目的,从而实现了提高服务器运行的稳定性以及可靠性的技术效果。
由此可见,本申请所提供的流量调控系统可以解决现有技术无法对服务器的流量进行调控的技术问题。
实施例8
本发明的实施例可以提供一种计算机设备,该计算机设备可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机设备也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
图10示出了一种计算机设备的硬件结构框图。如图10所示,计算机设备A可以包括一个或多个(图中采用1002a、1002b,……,1002n来示出)处理器1002(处理器1002可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1004、以及用于通信功能的传输装置1006。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图10所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机设备A还可包括比图10中所示更多或者更少的组件,或者具有与图10所示不同的配置。
应当注意到的是上述一个或多个处理器1002和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机设备A中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
处理器1002可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
存储器1004可用于存储应用软件的软件程序以及模块,如本申请实施例中的分布式集群中服务器的流量调控方法对应的程序指令/数据存储装置,处理器1002通过运行存储在存储器1004内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的分布式集群中服务器的流量调控方法。存储器1004可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1004可进一步包括相对于处理器1002远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机设备A的通信供应商提供的无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1006可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机设备A的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图10所示的计算机设备A可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图10仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备A中的部件的类型。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:至少基于读写请求个数和读写请求字节数对虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,得到流量统计数据。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:根据时间片内的当前时间戳和时间片对应的处理能力上限确定允许处理的读写请求个数或读写请求字节数;根据流量统计数据中在时间片已处理的读写请求个数和读写请求字节数确定期望处理的读写请求个数或读写请求字节数;根据允许处理的读写请求个数或读写请求字节数与期望处理的读写请求个数或读写请求字节数的比较结果对读写任务进行流量控制。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:如果期望处理的读写请求个数小于或等于允许处理的读写请求个数以及期望处理的读写请求字节数小于或等于允许处理的读写请求字节数,则立即执行读写任务;如果期望处理的读写请求个数大于允许处理的读写请求个数或者期望处理的读写请求字节数大于允许处理的读写请求字节数,则延迟执行读写任务。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:采用期望处理的读写请求个数与允许处理的读写请求个数的差值再除以时间片对应的处理能力上限得到第一等待时长;采用期望处理的读写请求字节数与允许处理的读写请求字节数的差值再除以时间片对应的处理能力上限得到第二等待时长;从第一等待时长与第二等待时长中选取较大等待时长;将期望处理的读写请求个数放入第一等待队列以及将期望处理的读写请求字节数放入第二等待队列,并在经历较大等待时长之后,触发执行在第一等待队列和第二等待队列的读写任务。
在本实施例中,上述计算机设备A可以执行应用程序的分布式集群中服务器的流量调控方法中以下步骤的程序代码:按照先入先出原则对第一等待队列内放入的期望处理的读写请求个数重新计算第一等待时长以及对第二等待队列内放入的期望处理的读写请求字节数重新计算第二等待时长;如果重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列;对临时队列内等待处理的读写任务进行处理。
本领域普通技术人员可以理解,图10所示的结构仅为示意,计算机设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,计算机设备A还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例9
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的分布式集群中服务器的流量调控方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,第一存储区域用于存储磁盘快照数据,第二存储区域用于存储根据磁盘快照数据实例化恢复出的数据;根据流量统计数据对读写任务进行流量控制。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:至少基于读写请求个数和读写请求字节数对虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,得到流量统计数据。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:根据时间片内的当前时间戳和时间片对应的处理能力上限确定允许处理的读写请求个数或读写请求字节数;根据流量统计数据中在时间片已处理的读写请求个数和读写请求字节数确定期望处理的读写请求个数或读写请求字节数;根据允许处理的读写请求个数或读写请求字节数与期望处理的读写请求个数或读写请求字节数的比较结果对读写任务进行流量控制。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:如果期望处理的读写请求个数小于或等于允许处理的读写请求个数以及期望处理的读写请求字节数小于或等于允许处理的读写请求字节数,则立即执行读写任务;如果期望处理的读写请求个数大于允许处理的读写请求个数或者期望处理的读写请求字节数大于允许处理的读写请求字节数,则延迟执行读写任务。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:采用期望处理的读写请求个数与允许处理的读写请求个数的差值再除以时间片对应的处理能力上限得到第一等待时长;采用期望处理的读写请求字节数与允许处理的读写请求字节数的差值再除以时间片对应的处理能力上限得到第二等待时长;从第一等待时长与第二等待时长中选取较大等待时长;将期望处理的读写请求个数放入第一等待队列以及将期望处理的读写请求字节数放入第二等待队列,并在经历较大等待时长之后,触发执行在第一等待队列和第二等待队列的读写任务。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:按照先入先出原则对第一等待队列内放入的期望处理的读写请求个数重新计算第一等待时长以及对第二等待队列内放入的期望处理的读写请求字节数重新计算第二等待时长;如果重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列;对临时队列内等待处理的读写任务进行处理。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (17)

1.一种分布式集群中服务器的流量调控方法,其特征在于,包括:
对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,所述第一存储区域用于存储磁盘快照数据,所述第二存储区域用于存储根据所述磁盘快照数据实例化恢复出的数据;
根据流量统计数据对所述读写任务进行流量控制。
2.根据权利要求1所述的方法,其特征在于,对所述虚拟机在所述第一存储区域与所述第二存储区域之间执行的读写任务进行流量统计包括:
至少基于读写请求个数和读写请求字节数对所述虚拟机在所述第一存储区域与所述第二存储区域之间执行的读写任务进行流量统计,得到所述流量统计数据。
3.根据权利要求1或2所述的方法,其特征在于,根据所述流量统计数据对所述读写任务进行流量控制包括:
根据时间片内的当前时间戳和所述时间片对应的处理能力上限确定允许处理的读写请求个数或读写请求字节数;
根据所述流量统计数据中在所述时间片已处理的读写请求个数和读写请求字节数确定期望处理的读写请求个数或读写请求字节数;
根据所述允许处理的读写请求个数或读写请求字节数与所述期望处理的读写请求个数或读写请求字节数的比较结果对所述读写任务进行流量控制。
4.根据权利要求3所述的方法,其特征在于,通过所述允许处理的读写请求个数或读写请求字节数与所述期望处理的读写请求个数或读写请求字节数的比较结果对所述读写任务进行流量控制包括:
如果所述期望处理的读写请求个数小于或等于所述允许处理的读写请求个数以及所述期望处理的读写请求字节数小于或等于所述允许处理的读写请求字节数,则立即执行所述读写任务;
如果所述期望处理的读写请求个数大于所述允许处理的读写请求个数或者所述期望处理的读写请求字节数大于所述允许处理的读写请求字节数,则延迟执行所述读写任务。
5.根据权利要求4所述的方法,其特征在于,延迟执行所述读写任务包括:
采用所述期望处理的读写请求个数与所述允许处理的读写请求个数的差值再除以所述时间片对应的处理能力上限得到第一等待时长;
采用所述期望处理的读写请求字节数与所述允许处理的读写请求字节数的差值再除以所述时间片对应的处理能力上限得到第二等待时长;
从所述第一等待时长与所述第二等待时长中选取较大等待时长;
将所述期望处理的读写请求个数放入第一等待队列以及将所述期望处理的读写请求字节数放入第二等待队列,并在经历所述较大等待时长之后,触发执行在所述第一等待队列和所述第二等待队列的读写任务。
6.根据权利要求5所述的方法,其特征在于,在触发执行在所述第一等待队列和所述第二等待队列的读写任务之后,还包括:
按照先入先出原则对所述第一等待队列内放入的所述期望处理的读写请求个数重新计算第一等待时长以及对所述第二等待队列内放入的所述期望处理的读写请求字节数重新计算第二等待时长;
如果重新计算的第一等待时长与重新计算的第二等待时长均满足预设条件,则将等待处理的读写任务放入临时队列;
对所述临时队列内等待处理的读写任务进行处理。
7.一种分布式集群中主控服务器的流量调控方法,其特征在于,包括:
接收分布式集群下多个集群服务器分别上报的统计结果,其中,所述统计结果由每个集群服务器对负责管控的多个服务器分别上报的流量统计数据和/或当前正在执行读写任务的虚拟机的数量进行统计得到,所述流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;
根据所述统计结果从所述多个集群服务器中确定部分集群服务器进入临时停止服务状态。
8.根据权利要求7所述的方法,其特征在于,根据所述统计结果从所述多个集群服务器中确定所述部分集群服务器进入所述临时停止服务状态包括:
根据每个集群服务器分别上报的统计结果确定每个集群服务器的流量负载;
从所述多个集群服务器中选取所述流量负载超过预设流量范围的集群服务器,确定为所述部分集群服务器;
将所述部分集群服务器设置为临时停止服务状态,并停止向所述部分集群服务器分配新的虚拟机创建请求。
9.根据权利要求8所述的方法,其特征在于,在根据所述统计结果从所述多个集群服务器中确定所述部分集群服务器进入所述临时停止服务状态之后,还包括:
如果根据所述部分集群服务器在后续上报周期内上报的统计结果确定所述部分集群服务器的流量负载恢复至所述预设流量范围内,则将所述部分集群服务器设置为可服务状态,并重新向所述部分集群服务器分配新的虚拟机创建请求。
10.根据权利要求8所述的方法,其特征在于,在根据所述统计结果从所述多个集群服务器中确定所述部分集群服务器进入所述临时停止服务状态之后,还包括:
在接收到新的虚拟机创建请求之后,根据所述多个集群服务器中除所述部分集群服务器之外剩余的集群服务器上当前执行数据恢复任务所产生的读写流量以及参与执行所述数据恢复任务的虚拟机数量,分配所述新的虚拟机创建请求。
11.根据权利要求7所述的方法,其特征在于,根据所述统计结果从所述多个集群服务器中确定所述部分集群服务器进入所述临时停止服务状态包括:
根据每个集群服务器分别上报的统计结果确定每个集群服务器的当前正在执行所述读写任务中数据恢复任务的虚拟机的数量;
从所述多个集群服务器中选取同一集群服务器下每个服务器当前正在执行所述数据恢复任务的虚拟机的数量均超过预设阈值的集群服务器,确定为所述部分集群服务器;
将所述部分集群服务器设置为临时停止服务状态,并停止向所述部分集群服务器分配新的虚拟机创建请求。
12.根据权利要求11所述的方法,其特征在于,在根据所述统计结果从所述多个集群服务器中确定所述部分集群服务器进入所述临时停止服务状态之后,还包括:
如果确定所述部分集群服务器下各个服务器当前正在执行所述数据恢复任务已经执行完毕,则将所述部分集群服务器设置为可服务状态,并重新向所述部分集群服务器分配新的虚拟机创建请求。
13.一种分布式集群中集群服务器的流量调控方法,其特征在于,包括:
接收当前集群内多个服务器分别上报的每个服务器的流量统计数据以及在每个服务器当前正在执行读写任务的虚拟机的数量,其中,所述流量统计数据通过每个服务器对接入该服务器的虚拟机执行的读写任务进行流量统计得到;
对多个服务器分别上报的流量统计数据以及当前正在执行所述读写任务的虚拟机的数量进行统计,得到统计结果;
将所述统计结果上报至主控服务器,其中,所述主控服务器负责管控分布式集群下的多个集群服务器,所述统计结果供所述主控服务器确认是否控制部分集群服务器进入临时停止服务状态。
14.根据权利要求13所述的方法,其特征在于,在对所述多个服务器分别上报的流量统计数据以及当前正在执行所述读写任务的虚拟机的数量进行统计,得到所述统计结果之后,还包括:
如果根据所述统计结果确定所述读写任务的性能参数超过第一预设阈值,则根据所述当前集群内正在执行所述读写任务的虚拟机的数量重新分配处理所述读写任务的资源,其中,所述性能参数为以下之一:所述当前集群内数据快照任务对应的读写请求字节数总和、所述当前集群内数据快照任务对应的读写请求个数总和、所述当前集群内数据恢复任务对应的读写请求字节数总和、所述当前集群内数据恢复任务对应的读写请求个数总和。
15.根据权利要求13所述的方法,其特征在于,在对所述多个服务器分别上报的流量统计数据以及当前正在执行所述读写任务的虚拟机的数量进行统计,得到所述统计结果之后,还包括:
如果根据所述统计结果确定所述读写任务的性能参数低于第二预设阈值,则根据当前已经分配的处理所述读写任务的资源重新设置所述性能参数的上限值,其中,所述性能参数为以下之一:所述当前集群内数据快照任务对应的读写请求字节数总和、所述当前集群内数据快照任务对应的读写请求个数总和、所述当前集群内数据恢复任务对应的读写请求字节数总和、所述当前集群内数据恢复任务对应的读写请求个数总和。
16.根据权利要求14或15所述的方法,其特征在于,相邻两次重新分配处理所述读写任务的资源或重新设置所述性能参数的上限值之间的时间间隔大于第三预设阈值。
17.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如下步骤:
对接入分布式集群中服务器的虚拟机在第一存储区域与第二存储区域之间执行的读写任务进行流量统计,其中,所述第一存储区域用于存储磁盘快照数据,所述第二存储区域用于存储根据所述磁盘快照数据实例化恢复出的数据;
根据流量统计数据对所述读写任务进行流量控制。
CN201810687976.9A 2018-06-28 2018-06-28 分布式集群中服务器的流量调控方法及存储介质 Active CN110661824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810687976.9A CN110661824B (zh) 2018-06-28 2018-06-28 分布式集群中服务器的流量调控方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810687976.9A CN110661824B (zh) 2018-06-28 2018-06-28 分布式集群中服务器的流量调控方法及存储介质

Publications (2)

Publication Number Publication Date
CN110661824A true CN110661824A (zh) 2020-01-07
CN110661824B CN110661824B (zh) 2022-04-12

Family

ID=69026374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810687976.9A Active CN110661824B (zh) 2018-06-28 2018-06-28 分布式集群中服务器的流量调控方法及存储介质

Country Status (1)

Country Link
CN (1) CN110661824B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112165436A (zh) * 2020-10-15 2021-01-01 腾讯科技(深圳)有限公司 流量控制方法、装置及系统
CN112272100A (zh) * 2020-08-04 2021-01-26 淘宝(中国)软件有限公司 一种针对在线平台局部业务需求的高可用流量调控方法和装置
CN112463370A (zh) * 2020-11-20 2021-03-09 深圳市雷鸟网络传媒有限公司 任务执行方法、设备及可读存储介质
WO2022001917A1 (zh) * 2020-07-01 2022-01-06 阿里巴巴集团控股有限公司 一种数据流统计方法、设备及存储介质
CN114443228A (zh) * 2022-01-25 2022-05-06 苏州浪潮智能科技有限公司 一种虚拟机流量控制方法、装置、电子设备及存储介质
CN115378879A (zh) * 2022-08-22 2022-11-22 Oppo广东移动通信有限公司 数据控制方法及相关装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739113A (zh) * 2008-11-20 2010-06-16 国际商业机器公司 在虚拟化集群系统中进行能效管理的方法及装置
US20120291088A1 (en) * 2011-05-10 2012-11-15 Sybase, Inc. Elastic resource provisioning in an asymmetric cluster environment
CN103236949A (zh) * 2013-04-27 2013-08-07 北京搜狐新媒体信息技术有限公司 一种服务器集群的监控方法、装置与系统
US20150039936A1 (en) * 2013-07-31 2015-02-05 Cleversafe, Inc. Distributed storage network with alternative foster storage approaches and methods for use therewith
CN104580396A (zh) * 2014-12-19 2015-04-29 华为技术有限公司 一种任务调度方法、节点及系统
CN105187531A (zh) * 2015-09-09 2015-12-23 上海赛为信息技术有限公司 应用于云计算虚拟化服务器集群的负载均衡的系统及方法
CN105335219A (zh) * 2014-07-08 2016-02-17 阿里巴巴集团控股有限公司 一种基于分布式的任务调度方法及系统
US20160182395A1 (en) * 2012-08-25 2016-06-23 Vmware, Inc. Remote service for executing resource allocation analyses for distributed computer systems
CN105786611A (zh) * 2014-12-16 2016-07-20 中国移动通信集团公司 一种分布式集群的任务调度方法及装置
CN107483634A (zh) * 2017-09-21 2017-12-15 上海七牛信息技术有限公司 一种负载均衡方法以及系统
CN107580023A (zh) * 2017-08-04 2018-01-12 山东大学 一种动态调整任务分配的流处理作业调度方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739113A (zh) * 2008-11-20 2010-06-16 国际商业机器公司 在虚拟化集群系统中进行能效管理的方法及装置
US20120291088A1 (en) * 2011-05-10 2012-11-15 Sybase, Inc. Elastic resource provisioning in an asymmetric cluster environment
US20160182395A1 (en) * 2012-08-25 2016-06-23 Vmware, Inc. Remote service for executing resource allocation analyses for distributed computer systems
CN103236949A (zh) * 2013-04-27 2013-08-07 北京搜狐新媒体信息技术有限公司 一种服务器集群的监控方法、装置与系统
US20150039936A1 (en) * 2013-07-31 2015-02-05 Cleversafe, Inc. Distributed storage network with alternative foster storage approaches and methods for use therewith
CN105335219A (zh) * 2014-07-08 2016-02-17 阿里巴巴集团控股有限公司 一种基于分布式的任务调度方法及系统
CN105786611A (zh) * 2014-12-16 2016-07-20 中国移动通信集团公司 一种分布式集群的任务调度方法及装置
CN104580396A (zh) * 2014-12-19 2015-04-29 华为技术有限公司 一种任务调度方法、节点及系统
CN105187531A (zh) * 2015-09-09 2015-12-23 上海赛为信息技术有限公司 应用于云计算虚拟化服务器集群的负载均衡的系统及方法
CN107580023A (zh) * 2017-08-04 2018-01-12 山东大学 一种动态调整任务分配的流处理作业调度方法及系统
CN107483634A (zh) * 2017-09-21 2017-12-15 上海七牛信息技术有限公司 一种负载均衡方法以及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙乔; 邓卜侨; 王志强; 裴旭斌: "一种基于分布式服务器集群的可扩展负载均衡策略技术", 《电信科学》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022001917A1 (zh) * 2020-07-01 2022-01-06 阿里巴巴集团控股有限公司 一种数据流统计方法、设备及存储介质
CN112272100A (zh) * 2020-08-04 2021-01-26 淘宝(中国)软件有限公司 一种针对在线平台局部业务需求的高可用流量调控方法和装置
CN112272100B (zh) * 2020-08-04 2022-05-27 淘宝(中国)软件有限公司 一种针对在线平台局部业务需求的高可用流量调控方法和装置
CN112165436A (zh) * 2020-10-15 2021-01-01 腾讯科技(深圳)有限公司 流量控制方法、装置及系统
CN112165436B (zh) * 2020-10-15 2024-02-20 腾讯科技(深圳)有限公司 流量控制方法、装置及系统
CN112463370A (zh) * 2020-11-20 2021-03-09 深圳市雷鸟网络传媒有限公司 任务执行方法、设备及可读存储介质
CN114443228A (zh) * 2022-01-25 2022-05-06 苏州浪潮智能科技有限公司 一种虚拟机流量控制方法、装置、电子设备及存储介质
CN114443228B (zh) * 2022-01-25 2024-10-18 苏州浪潮智能科技有限公司 一种虚拟机流量控制方法、装置、电子设备及存储介质
CN115378879A (zh) * 2022-08-22 2022-11-22 Oppo广东移动通信有限公司 数据控制方法及相关装置

Also Published As

Publication number Publication date
CN110661824B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN110661824B (zh) 分布式集群中服务器的流量调控方法及存储介质
US9442763B2 (en) Resource allocation method and resource management platform
US20170177221A1 (en) Dynamic core allocation for consistent performance in a non-preemptive scheduling environment
CN110515724B (zh) 资源配置方法、装置、监视器及机器可读存储介质
US10394606B2 (en) Dynamic weight accumulation for fair allocation of resources in a scheduler hierarchy
EP2856318A1 (en) Method and apparatus for single point of failure elimination for cloud-based applications
CN105159775A (zh) 基于负载均衡器的云计算数据中心的管理系统和管理方法
US11461199B2 (en) Redundancy method, device, and system
CN108874502B (zh) 云计算集群的资源管理方法、装置及设备
CN105302497A (zh) 一种缓存管理方法与系统
CN110362402A (zh) 一种负载均衡方法、装置、设备及可读存储介质
CN110858986A (zh) 带宽调整方法、装置、通信设备及计算机可读存储介质
CN113821340A (zh) 分布式系统的动态均衡方法、系统、终端及存储介质
CN115469813A (zh) 数据处理方法及装置、存储介质、电子装置
CN114244718A (zh) 一种输电线路通信网络设备管理系统
WO2024148864A1 (zh) 虚拟机内存的调整方法和装置、非易失性可读存储介质及电子装置
CN106775925B (zh) 一种虚拟机cpu的限额处理方法和装置
CN109510730A (zh) 分布式系统及其监控方法、装置、电子设备及存储介质
CN115378885A (zh) 超融合架构下的虚拟机业务网络带宽管理方法及装置
CN116166181A (zh) 一种云监控方法和云管理平台
CN113703678A (zh) 一种存储桶索引重分裂的方法、装置、设备和介质
CN113259975A (zh) 网络游戏连接方法、电子设备和计算机可读介质
CN109002347B (zh) 一种虚拟机内存分配方法、装置及系统
CN112269721A (zh) 一种性能数据统计的方法、系统、设备及可读存储介质
CN110955644A (zh) 一种存储系统的io控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230601

Address after: Room 1-2-A06, Yungu Park, No. 1008 Dengcai Street, Sandun Town, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Aliyun Computing Co.,Ltd.

Address before: Box 847, four, Grand Cayman capital, Cayman Islands, UK

Patentee before: ALIBABA GROUP HOLDING Ltd.