CN115442369B - 一种服务资源调度的方法、装置、存储介质及电子设备 - Google Patents

一种服务资源调度的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115442369B
CN115442369B CN202211069146.2A CN202211069146A CN115442369B CN 115442369 B CN115442369 B CN 115442369B CN 202211069146 A CN202211069146 A CN 202211069146A CN 115442369 B CN115442369 B CN 115442369B
Authority
CN
China
Prior art keywords
service
service cluster
cluster
index
machines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211069146.2A
Other languages
English (en)
Other versions
CN115442369A (zh
Inventor
李德怀
胡忠想
刘波
孙元涛
舒超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xinghan Future Network Technology Co ltd
Original Assignee
Beijing Xinghan Future Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xinghan Future Network Technology Co ltd filed Critical Beijing Xinghan Future Network Technology Co ltd
Priority to CN202211069146.2A priority Critical patent/CN115442369B/zh
Publication of CN115442369A publication Critical patent/CN115442369A/zh
Application granted granted Critical
Publication of CN115442369B publication Critical patent/CN115442369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本申请的一些实施例提供了一种服务资源调度的方法、装置、存储介质及电子设备,该方法包括:将接收到的客户端的请求流量分配到第一服务集群;采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零。本申请的一些实施例可以实现对服务集群的动态调度,提升服务集群的资源利用率。

Description

一种服务资源调度的方法、装置、存储介质及电子设备
技术领域
本申请涉及云服务技术领域,具体而言,涉及一种服务资源调度的方法、装置、存储介质及电子设备。
背景技术
随着数字化时代的发展,利用私有云、公有云或混合云作为企业的IT(Information Technology,信息技术)基础设施是企业数字化转型的关键环节。
目前,云厂商一般根据业务类型对机器进行适应的比例配置,为企业提供三种类型的机器租用方式,如包年包月、按量机器和竞价机器。一般企业为了确保业务的稳定性,不同的业务部门通常会对包年包月的机器或私有云机器进行高冗余的配置,从而造成了机器资源利用率较低且机器成本的浪费。
因此,如何提供一种服务资源利用率较高的服务资源调度的方法的技术方案成为亟需解决的技术问题。
发明内容
本申请的一些实施例的目的在于提供一种服务资源调度的方法、装置、存储介质及电子设备,通过本申请的实施例的技术方案可以实现对服务集群的动态调度,降低服务资源配置的冗余度,提升服务资源的利用率,降低企业的IT成本。
第一方面,本申请的一些实施例提供了一种服务资源调度的方法,包括:将接收到的客户端的请求流量分配到第一服务集群;采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零。
本申请的一些实施例通过将请求流量分配至第一服务集群后,对第一服务集群的第一服务指标进行判定,最后根据判定结果确认服务请求流量的服务资源。该申请的一些实施例将整个服务集群分为三个服务集群,其中,第三服务集群为共享服务集群,供有需求的业务部门调用。通过对第一服务集群的第一服务指标分析,可以实现对三个服务集群中的资源的动态调度,降低服务资源配置的冗余度,提升服务资源的利用率,降低企业的IT成本。
在一些实施例,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:若所述第一服务指标大于第一指标阈值,则确认所述判定结果为所述第一服务指标属于第一服务区间;所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:在所述判定结果为所述第一服务区间时,将所述请求流量中的部分请求流量分配至所述第二服务集群。
本申请的一些实施例通过第一服务指标与第一指标阈值的关系确认承担请求流量的服务集群,可以实现服务资源的动态调度,确保为客户端提供正常服务的同时,提升资源利用率。
在一些实施例,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:若所述第一服务指标不大于所述第一指标阈值且不小于第二指标阈值,则确认所述判定结果为所述第一服务指标属于第二服务区间;所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:在所述判定结果为所述第二服务区间时,所述第一服务集群继续服务所述请求流量。
本申请的一些实施例通过第一服务指标与第一指标阈值和第二指标阈值间的关系确认服务请求流量的服务集群,可以实现服务资源的动态调度,确保为客户端提供正常服务的同时,提升资源利用率。
在一些实施例,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:若所述第一服务指标小于所述第二指标阈值,则确认所述判定结果为所述第一服务指标属于第三服务区间;所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:在所述判定结果为所述第三服务区间时,将所述第一服务集群中的部分机器放入所述第三服务集群,得到更新后第一服务集群;将所述请求流量分配至所述更新后第一服务集群。
本申请的一些实施例通过第一服务指标与第二指标阈值间的关系确认服务请求流量的服务集群,可以实现服务资源的动态调度,确保为客户端提供正常服务的同时,提升资源利用率。
在一些实施例,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,所述方法还包括:采集所述第二服务集群的第二服务指标;若确认所述第二服务指标大于第一设定阈值,则将所述第二服务集群中的机器调度到所述第一服务集群。
本申请的一些实施例通过第二服务集群的第二服务指标与自身的第一设定阈值之间的关系,确认将第二服务集群的机器调度到第一服务集群,以此实现对服务集群的资源利用情况的准确划分,确保整体服务的稳定性。
在一些实施例,所述方法还包括:若确认所述第二服务指标不大于所述第一设定阈值且不小于第二设定阈值,则将所述第三服务集群中的预设数量机器添加至所述第二服务集群中,得到更新后第二服务集群;将所述部分请求流量分配至所述更新后第二服务集群。
本申请的一些实施例通过第二服务指标与第一设定阈值和第二设定阈值之间的关系,确认第二服务集群可承受能力,并可以从第三服务集群调度预设数量集群支持第二服务集群,确保整体服务的稳定性。
在一些实施例,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,所述方法还包括:若确认所述第二服务指标小于所述第二设定阈值,则将所述第二服务集群中的部分机器添加至所述第三服务集群,获取所述更新后第二服务集群。
本申请的一些实施例通过第二服务指标与第二设定阈值之间的关系,将第二服务集群存在的未利用的服务资源添加至第三服务集群,可以供其他业务部门调用。
在一些实施例,所述方法还包括:若确认所述第二服务指标小于所述第二设定阈值,且所述第二服务集群中的机器数量小于设定数量阈值,则不调度所述第二服务集群中的机器。
本申请的一些实施例在小于第二服务指标且小于设定数量阈值时不对第二服务集群中的机器进行调整,确保第二服务集群保持充足的服务资源,维护整个服务的稳定性。
在一些实施例,所述方法还包括:若所述第二服务集群中的机器数量小于所述设定数量阈值,则利用所述第三服务集群中的目标数量机器对所述第二服务集群进行更新,以使所述第二服务集群中的机器数量等于所述设定数量阈值。
本申请的一些实施例通过在第二服务集群中的集群数量不满足设定数量阈值时,通过第三服务集群对其进行更新,确保第二服务集群保持充足的服务资源,维护整个服务的稳定性。
在一些实施例,所述第一服务集群中的机器数量和所述第二服务集群中的机器数量的比值为目标值。
本申请的一些实施例通过确保第一服务集群和第二服务集群中的机器数量的比例,可以保证整体服务的稳定性。
第二方面,本申请的一些实施例提供了一种服务资源调度的装置,包括:分配模块,被配置为将接收到的客户端的请求流量分配到第一服务集群;判定模块,被配置为采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;调度模块,被配置为根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零。
第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的方法。
第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的方法。
第五方面,本申请的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的方法。
附图说明
为了更清楚地说明本申请的一些实施例的技术方案,下面将对本申请的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请的一些实施例提供的一种服务资源调度的系统图;
图2为本申请的一些实施例提供的服务资源调度的方法流程图之一;
图3为本申请的一些实施例提供的服务资源调度的方法流程图之二;
图4为本申请的一些实施例提供的服务资源调度的装置组成框图;
图5为本申请的一些实施例提供的一种电子设备示意图。
具体实施方式
下面将结合本申请的一些实施例中的附图,对本申请的一些实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
相关技术中,数字化时代,利用私有云、公有云、混合云作为企业的IT基础设施是企业数字化转型的关键环节。云具有弹性伸缩、随取随用和按需付费的特性,可以帮助企业大幅降低IT资源使用成本,提高资源的业务使用效率。
云厂商一般提供三种类型的实例(也就是机器):包年包月、按量实例和竞价实例。其中,包年包月的价格一般是按量实例的2到3倍。按量实例的价格一般又是竞价实例的4到5倍。但是由于竞价实例的稳定性无法保证,因此一般企业的正常业务会使用包年包月和按量实例这两种类型,而实例的数量是需要根据业务类型进行适应的比例进行配置的。
在实际的企业业务场景中,为了保障业务的稳定性,不同业务部门往往会对包年包月机器或私有云机器进行高冗余度的配置,但是存在资源利用率低下、IT成本大量浪费的情况。为了解决同一个业务部门的组织内部对机器的资源利用率较低的问题,通过建立组织级的算力资源共享池(也称为服务资源共享池),各业务部门可以将空闲的包年包月机器或私有云机器放到算力资源共享池里,当任意一个业务部门有业务需要时再申请使用。但是,由于各业务部门无法精准预估服务资源的实际需求,担心共享过多的机器会导致在真正需要时申请不到,因此会非常保守的预估自身可以共享的资源,进而可以为自己的业务保留大量的冗余资源,以备不时之需,然而该方法并不能很好地提升整体的服务资源的利用率,利用率还是较低。
鉴于此,本申请的一些实施例提供了一种服务资源调度的方法,该方法通过将整个服务集群中的机器分为三个集群,且每个集群的服务资源利用率不同。通过将请求流量分配至第一服务集群后,对第一服务集群的第一服务指标进行判定,最后根据判定结果确认是否调用第二服务集群或第三服务集群中的机器服务该请求流量,或者确认是否将第一服务集群或第二服务集群中的机器释放至第三服务集群,供有需求的业务部门调用。本申请的一些实施例可以实现对三个服务集群中的资源的动态调度,降低服务资源配置的冗余度,提升服务资源的利用率,降低企业的IT成本。
如图1所示,本申请的一些实施例提供了一种服务资源调度的系统,该系统包括:终端100、第一服务集群120、第二服务集群130和第三服务集群140。第一服务集群120中包括第一服务器121、第二服务器122、第三服务器123、第四服务器124、第五服务器125和第六服务器126。第二服务集群130包括:第七服务器131、第八服务器132和第九服务器133。第三服务集群140包括:第十服务器141、第十一服务器142和第十二服务器143。其中,当用户访问终端100时,终端100会将用户的请求首先发送至第一服务集群120,然后流量调度端110通过采集第一服务集群120的第一服务指标,并对第一服务指标与指标阈值进行对比,获取的判定结果。最后基于判定结果,以及第二服务集群和第三服务集群,确认用于处理用户的请求的服务资源,并将请求结果返回至终端100。
在本申请的一些实施例中,当第一服务集群120可承受的用户的请求流量超过阈值时,可以将用户的请求流量中的部分流量分配至第二服务集群130。当第二服务集群130的第二服务指标满足设定阈值时,可以将第二服务集群130中的服务器调度至第一服务集群120。而且,第一服务集群120或第二服务集群130可以将空闲的机器调度至第三服务集群140。第一服务集群120和第二服务集群130也可以根据实际情况按需调度相应的机器至自身集群,以实现对访问终端100的用户提供正常服务。
在本申请的一些实施例中,终端100可以是移动终端也可以是非便携的电脑终端。第一服务集群120、第二服务集群130和第三服务集群140中的机器可以是虚拟服务器也可以是实体服务器,每个服务集群中的机器数量可以根据实际情况进行设定,本申请并不局限于此。
下面结合附图2示例性阐述本申请的一些实施例提供的由流量调度端110执行的服务资源调度的方法实现过程。
请参见附图2,图2为本申请的一些实施例提供的一种服务资源调度的方法流程图,该方法包括:S210,将接收到的客户端的请求流量分配到第一服务集群。S220,采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果。S230,根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零。
例如,在本申请的一些实施例中,将同一个业务集群中的机器分为三部分,也就是1组(作为第一服务集群120的一个具体示例)、2组(作为第二服务集群130的一个具体示例)和3组(作为第三服务集群140的一个具体示例)。其中,1组也可以称为高资源利用区,也就是在开始提供服务时,将请求流量集中分配给1组,使其达到或接近1组的机器在满足对外服务质量的情况下所能承载流量的极限。2组是低资源利用区,也可以称为预备缓冲区,承担请求流量中的一小部分流量,其中,2组中的每台机器所承载的流量相比承受极限很少。3组称为共享区,3组中的机器完全空闲,不承担任何流量压力,完全放到共享区的共享池中供有需要的业务使用。
例如,在本申请的一些实施例中,当1组承受的业务的流量(作为请求流量的一个具体示例)增加时,2组会首先承担流量的压力,保证整体服务的稳定性。当流量新增到一定程度后,2组会有一部分机器调度到1组中,被调度到1组的机器会进行高利用率运转,同时从共享池里补充同等规格数量或服务能力相同的机器到2组中。当流量减少时,1组的流量压力会首先减少,在保持1组每台机器高利用率的情况下,减少的流量会集中减轻一部分机器的压力,当流量减少到一定程度,会有空闲的机器出来,此时可以将1组空闲的机器补充到3组中,作为共享的资源。
下面示例性阐述上述过程。
在本申请的一些实施例中,所述第一服务集群中的机器数量和所述第二服务集群中的机器数量的比值为目标值。
例如,在本申请的一些实施例中,每个业务的服务算力池(也可以称为服务资源池)从逻辑上划分为两部分,高资源利用区和低资源利用区,高资源利用区的比例一般远高于低资源利用区,比如目标值为4:1、10:1等等。
需要说明的是,在本申请的一些实施例中,第一服务指标或第二服务指标可以是CPU利用率、慢速比、平均耗时和冗余度中的一种或多种。应理解,第一服务指标或第二服务指标包含上述所有指标,但是本申请并不局限于此。
在本申请的一些实施例中,S220可以包括:若所述第一服务指标大于第一指标阈值,则确认所述判定结果为所述第一服务指标属于第一服务区间。S230可以包括:在所述判定结果为所述第一服务区间时,将所述请求流量中的部分请求流量分配至所述第二服务集群。
例如,在本申请的一些实施例中,通过设定指标阈值来确认此时第一服务集群的资源利用情况。例如,第一服务指标为CPU利用率,第一设定阈值为A1,当采集到的CPU利用率>A1(作为第一服务区间的一个具体示例)时,说明高资源利用区的机器的承载流量的压力已经达到极限,此时,需要获取除高资源利用区的机器所承载的请求流量之外的部分流量分配到低资源利用区。
在本申请的另一些实施例中,S220可以包括:若所述第一服务指标不大于所述第一指标阈值且不小于第二指标阈值,则确认所述判定结果为所述第一服务指标属于第二服务区间。S230可以包括:在所述判定结果为所述第二服务区间时,所述第一服务集群继续服务所述请求流量。
例如,在本申请的另一些实施例中,第二指标阈值为A2,当采集到的A2≤CPU利用率≤A1(作为第二服务区间的一个具体示例)时,说明高资源利用区的机器可以承受当前的请求流量,且高资源利用区的机器在充分运转,因此只需要高资源利用区继续处理该请求流量即可。
在本申请的另一些实施例中,S220可以包括:若所述第一服务指标小于所述第二指标阈值,则确认所述判定结果为所述第一服务指标属于第三服务区间。S230可以包括:在所述判定结果为所述第三服务区间时,将所述第一服务集群中的部分机器放入所述第三服务集群,得到更新后第一服务集群;将所述请求流量分配至所述更新后第一服务集群。
例如,在本申请的另一些实施例中,当采集到的CPU利用率<A2(作为第三服务区间的一个具体示例)时,说明高资源利用区的机器没有被完全占用,此时的资源利用率较低。因此,可以计算出服务请求流量的机器后,将部分机器调度至共享区。例如,高资源利用区有100台机器,当前请求流量只需要70台即可保证服务的稳定性,因此将部分的30台机器释放到共享区,供其他业务使用。
在本申请的一些实施例中,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,服务资源调度的方法还包括:采集所述第二服务集群的第二服务指标;若确认所述第二服务指标大于第一设定阈值,则将所述第二服务集群中的机器调度到所述第一服务集群。
例如,在本申请的一些实施例中,低资源利用区接收到部分请求流量的任务后,还需要监控低资源利用区的情况。低资源利用区的第二服务指标也为CPU利用率,第一设定阈值为B1。当CPU利用率>B1时,说明低资源利用区的机器在高速运转,此时的资源利用率较高,因此需要将低资源利用区的机器调度至高资源利用区。需要说明的是,可以根据实际情况确认低资源利用区达到B1的机器的台数(可以是一台也可以是全部),将对应的台数调度至高资源利用区。
在本申请的一些实施例中,服务资源调度的方法还包括:若确认所述第二服务指标不大于所述第一设定阈值且不小于第二设定阈值,则将所述第三服务集群中的预设数量机器添加至所述第二服务集群中,得到更新后第二服务集群;将所述部分请求流量分配至所述更新后第二服务集群。
例如,在本申请的一些实施例中,第二设定阈值为B2,若B2≤CPU利用率≤B1时,说明低资源利用区的资源利用率较高,此时可以将共享区的预设数量集群添加到低资源利用区,然后动态调整部分请求流量的分配情况,使得部分请求流量可以均与分配至当前低资源利用区中的每台机器上。例如,低资源利用区有20台机器,通过计算可知还需要2台机器才可以维持服务的稳定性,此时可以从共享区调2台机器添加到低资源利用区。最后将部分请求流量均匀分配至22台机器上。
在本申请的另一些实施例中,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,服务资源调度的方法还包括:若确认所述第二服务指标小于所述第二设定阈值,则将所述第二服务集群中的部分机器添加至所述第三服务集群,获取所述更新后第二服务集群。
例如,在本申请的另一些实施例中,当采集到的CPU利用率<B2时,说明低资源利用区的机器没有被完全占用,此时的资源利用率较低。因此,可以计算出可为请求流量提供稳定服务的机器后,将部分机器调度至共享区。例如,低资源利用区有20台机器,当前请求流量只需要12台即可保证服务的稳定性,因此将部分的8台机器释放到共享区,供其他业务使用。
为了确保服务集群的稳定性,在本申请的一些实施例中,服务资源调度的方法还包括:若确认所述第二服务指标小于所述第二设定阈值,且所述第二服务集群中的机器数量小于设定数量阈值,则不调度所述第二服务集群中的机器。
例如,在本申请的一些实施例中,为了确保整体服务的稳定性,低资源利用区的机器数量需要满足设定数量阈值,例如,低资源利用区最低为10台机器。如果低资源利用区的机器数量小于10台,但是资源利用率较低时,也不会将部分机器调入到共享区,以此保持服务集群有足够的算力冗余度。
在本申请的一些实施例中,服务资源调度的方法还包括:若所述第二服务集群中的机器数量小于所述设定数量阈值,则利用所述第三服务集群中的目标数量机器对所述第二服务集群进行更新,以使所述第二服务集群中的机器数量等于所述设定数量阈值。
例如,在本申请的另一些实施例中,在低资源利用区的机器数量没有达到设定数量阈值时,需要从共享区调度相应的目标数量集群填充。例如,当前低资源利用区中有7台机器,小于10台,此时将共享区中的3台调度至低资源利用区。其中,3台就是上述的目标数量机器。
需要说明的是,在本申请的另一些实施例中,第一服务集群的指标阈值以及第二服务集群的设定阈值中的阈值数量,可以根据实际情况进行细分,例如,第一服务集群设定4个指标阈值,分别为第一指标阈值、第二指标阈值、第三指标阈值和第四指标阈值。第二服务集群也可以有4个设定阈值等等。应知晓本申请并不局限于此。
另外,在本申请的一些实施例中,通过负载均衡进行流量调度,将流量(也就是请求流量)优先集中于高资源利用区,通过高资源利用区、低资源利用区和共享区之间的机器流动来保证服务的稳定性和资源的高效利用率。若出现共享区无机器可用的情况,则可以通过扩缩容方式申请按量机器。后续当流量下降时优先释放这些按量服务的机器。
下面结合附图3示例性阐述本申请的一些实施例提供的服务资源调度的具体过程。
请参见附图3,图3为本申请的一些实施例提供的服务资源调度的方法流程图。下面示例性阐述上述过程。
S301,将接收到的客户端的请求流量分配到第一服务集群。
例如,作为本申请的一个具体示例,流量调度端110将客户端110的请求流量均匀的分配到服务集群的机器上,此时所有机器均标记为高资源利用区。
S302,采集所述第一服务集群的第一服务指标。
例如,作为本申请的一个具体示例,采集高资源利用区的服务质量SLA(ServiceLevel Agreement,服务指标)指标。
S303,判定第一服务指标所属的服务区间。若属于第一服务区间则执行S304,若属于第二服务区间则第一服务集群继续服务所述请求流量,若属于第三服务区间则执行S313。
例如,作为本申请的一个具体示例,SLA指标大于第一指标阈值,则确认属于第一服务区间。SLA指标在第一指标阈值和第二指标阈值之间,则确认属于第二服务区间。SLA指标小于第二指标阈值,则确认属于第三服务区间。
S304,将所述请求流量中的部分请求流量分配至所述第二服务集群。
例如,作为本申请的一个具体示例,流量调度器将一定比例(可以根据集群规模进行设置)的机器在服务注册表中标记为低资源利用区。在SLA指标属于第一服务区间时,说明此时高资源利用区资源利用率不足,则将部分请求流量分配至低资源利用区。低资源利用区会对部分请求流量提供服务。
S305,采集第二服务集群的第二服务指标。
例如,作为本申请的一个具体示例,采集低资源利用区的SLA指标。
S306,判定第二服务指标是否大于第一设定阈值,若是则执行S307,否则执行S308。
例如,作为本申请的一个具体示例,将低资源利用区的SLA指标与第一设定阈值B1对比。
S307,将所述第二服务集群中的机器调度到所述第一服务集群。
例如,作为本申请的一个具体示例,低资源利用区的SLA指标大于B1,表征低资源利用区的资源利用率较高,此时将低资源利用区的机器调度到高资源利用区。
S308,判定第二服务指标是否不大于第一设定阈值且不小于第二设定阈值,若是,则执行S309,否则执行S310。
S309,将所述第三服务集群中的预设数量机器添加至所述第二服务集群中,得到更新后第二服务集群;将所述部分请求流量分配至所述更新后第二服务集群。
例如,作为本申请的一个具体示例,SLA指标不大于B1,且不小于第二设定阈值B2。此时,低资源利用区可以增加预设数量机器分担该部分请求流量。
S310,判定第二服务指标是否小于第二设定阈值,且第二服务集群中的机器数量大于设定数量阈值,若是,则执行S311,否则执行S312。
例如,作为本申请的一个具体示例,设定数量阈值为20台机器。
S311,将所述第二服务集群中的部分机器添加至所述第三服务集群,获取所述更新后第二服务集群。返回S302。
例如,作为本申请的一个具体示例,SLA指标小于B2,表征低资源利用区的资源过剩,若低资源利用区的机器数量大于20,则将过剩资源机器释放到共享区。
S312,利用所述第三服务集群中的目标数量机器对所述第二服务集群进行更新。返回S302。
例如,作为本申请的一个具体示例,若低资源利用区的机器数量小于20,则从共享区调度相应数量的机器添加到低资源利用区,使低资源利用区的机器数量保持20台。
S313,将所述第一服务集群中的部分机器放入所述第三服务集群,并返回S302。
例如,作为本申请的一个具体示例,将高资源利用区中过剩的机器资源调度到共享区,供其他业务使用。
本申请提供的一些实施例通过设置低资源利用区,作为流量增长时的缓冲区,为服务的稳定性提供了保障,从而解决了业务部门担心共享资源后自己的业务稳定性得不到保证的问题。通过流量不均衡的调度方法,优先将流量分配到高资源利用区,提高了高资源利用区的资源利用率。通过稳定性保证和流量调度方法,各部门可以将更多的算力分配到共享区,需要时再申请,从而从组织层面提高了算力服务资源的利用效率,降低了算力资源浪费和采购成本。
请参考图4,图4示出了本申请的一些实施例提供的服务资源调度的装置的组成框图。应理解,该服务资源调度的装置与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该服务资源调度的装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
图4的服务资源调度的装置包括至少一个能以软件或固件的形式存储于存储器中或固化在服务资源调度的装置中的软件功能模块,该服务资源调度的装置包括:分配模块410,被配置为将接收到的客户端的请求流量分配到第一服务集群;判定模块420,被配置为采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;调度模块430,被配置为根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零。
在本申请的一些实施例中,判定模块420,被配置为:若所述第一服务指标大于第一指标阈值,则确认所述判定结果为所述第一服务指标属于第一服务区间;调度模块430,被配置为:在所述判定结果为所述第一服务区间时,将所述请求流量中的部分请求流量分配至所述第二服务集群。
在本申请的一些实施例中,判定模块420,被配置为:若所述第一服务指标不大于所述第一指标阈值且不小于第二指标阈值,则确认所述判定结果为所述第一服务指标属于第二服务区间;调度模块430,被配置为:在所述判定结果为所述第二服务区间时,所述第一服务集群继续服务所述请求流量。
在本申请的一些实施例中,判定模块420,被配置为:若所述第一服务指标小于所述第二指标阈值,则确认所述判定结果为所述第一服务指标属于第三服务区间;调度模块430,被配置为:在所述判定结果为所述第三服务区间时,将所述第一服务集群中的部分机器放入所述第三服务集群,得到更新后第一服务集群;将所述请求流量分配至所述更新后第一服务集群。
在本申请的一些实施例中,在判定模块420之后,服务资源调用的装置还包括(图中未示出):确认模块,被配置为:采集所述第二服务集群的第二服务指标;若确认所述第二服务指标大于第一设定阈值,则将所述第二服务集群中的机器调度到所述第一服务集群。
在本申请的一些实施例中,确认模块,被配置为:若确认所述第二服务指标不大于所述第一设定阈值且不小于第二设定阈值,则将所述第三服务集群中的预设数量机器添加至所述第二服务集群中,得到更新后第二服务集群;将所述部分请求流量分配至所述更新后第二服务集群。
在本申请的一些实施例中,确认模块,被配置为:若确认所述第二服务指标小于所述第二设定阈值,则将所述第二服务集群中的部分机器添加至所述第三服务集群,获取所述更新后第二服务集群。
在本申请的一些实施例中,确认模块,被配置为:若确认所述第二服务指标小于所述第二设定阈值,且所述第二服务集群中的机器数量小于设定数量阈值,则不调度所述第二服务集群中的机器。
在本申请的一些实施例中,确认模块,被配置为:若所述第二服务集群中的机器数量小于所述设定数量阈值,则利用所述第三服务集群中的目标数量机器对所述第二服务集群进行更新,以使所述第二服务集群中的机器数量等于所述设定数量阈值。
在本申请的一些实施例中,所述第一服务集群中的机器数量和所述第二服务集群中的机器数量的比值为目标值。
本申请的一些实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
本申请的一些实施例还提供了一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
如图5所示,本申请的一些实施例提供一种电子设备500,该电子设备500包括:存储器510、处理器520以及存储在存储器510上并可在处理器520上运行的计算机程序,其中,处理器520通过总线530从存储器510读取程序并执行所述程序时可实现如上述任意实施例的方法。
处理器520可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器520可以是微处理器。
存储器510可以用于存储由处理器520执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本申请实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器520可以用于执行存储器510中的指令以实现上述所示的方法。存储器510包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (13)

1.一种服务资源调度的方法,其特征在于,包括:
将接收到的客户端的请求流量分配到第一服务集群;
采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;
根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零,所述第三服务集群用于供其他业务请求调用。
2.如权利要求1所述的方法,其特征在于,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:
若所述第一服务指标大于第一指标阈值,则确认所述判定结果为所述第一服务指标属于第一服务区间;
所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:
在所述判定结果为所述第一服务区间时,将所述请求流量中的部分请求流量分配至所述第二服务集群。
3.如权利要求2所述的方法,其特征在于,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:
若所述第一服务指标不大于所述第一指标阈值且不小于第二指标阈值,则确认所述判定结果为所述第一服务指标属于第二服务区间;
所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:
在所述判定结果为所述第二服务区间时,所述第一服务集群继续服务所述请求流量。
4.如权利要求3所述的方法,其特征在于,所述判定所述第一服务指标所属的服务区间,得到判定结果,包括:
若所述第一服务指标小于所述第二指标阈值,则确认所述判定结果为所述第一服务指标属于第三服务区间;
所述根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,包括:
在所述判定结果为所述第三服务区间时,将所述第一服务集群中的部分机器放入所述第三服务集群,得到更新后第一服务集群;
将所述请求流量分配至所述更新后第一服务集群。
5.如权利要求2所述的方法,其特征在于,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,所述方法还包括:
采集所述第二服务集群的第二服务指标;
若确认所述第二服务指标大于第一设定阈值,则将所述第二服务集群中的机器调度到所述第一服务集群。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
若确认所述第二服务指标不大于所述第一设定阈值且不小于第二设定阈值,则将所述第三服务集群中的预设数量机器添加至所述第二服务集群中,得到更新后第二服务集群;
将所述部分请求流量分配至所述更新后第二服务集群。
7.如权利要求6所述的方法,其特征在于,在所述将所述请求流量中的部分请求流量分配至所述第二服务集群之后,所述方法还包括:
若确认所述第二服务指标小于所述第二设定阈值,则将所述第二服务集群中的部分机器添加至所述第三服务集群,获取所述更新后第二服务集群。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
若确认所述第二服务指标小于所述第二设定阈值,且所述第二服务集群中的机器数量小于设定数量阈值,则不调度所述第二服务集群中的机器。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
若所述第二服务集群中的机器数量小于所述设定数量阈值,则利用所述第三服务集群中的目标数量机器对所述第二服务集群进行更新,以使所述第二服务集群中的机器数量等于所述设定数量阈值。
10.如权利要求1、2、5-9中任一项所述的方法,其特征在于,所述第一服务集群中的机器数量和所述第二服务集群中的机器数量的比值为目标值。
11.一种服务资源调度的装置,其特征在于,包括:
分配模块,被配置为将接收到的客户端的请求流量分配到第一服务集群;
判定模块,被配置为采集所述第一服务集群的第一服务指标,并判定所述第一服务指标所属的服务区间,得到判定结果;
调度模块,被配置为根据所述判定结果,并基于第二服务集群或第三服务集群,确认用于服务所述请求流量的服务资源,其中,所述第一服务集群的资源利用率高于所述第二服务集群,所述第三服务集群的资源利用率为零,所述第三服务集群用于供其他业务请求调用。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行如权利要求1-10中任意一项权利要求所述的方法。
13.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并在所述处理器上运行的计算机程序,其中,所述计算机程序被所述处理器运行时执行如权利要求1-10中任意一项权利要求所述的方法。
CN202211069146.2A 2022-09-02 2022-09-02 一种服务资源调度的方法、装置、存储介质及电子设备 Active CN115442369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211069146.2A CN115442369B (zh) 2022-09-02 2022-09-02 一种服务资源调度的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211069146.2A CN115442369B (zh) 2022-09-02 2022-09-02 一种服务资源调度的方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN115442369A CN115442369A (zh) 2022-12-06
CN115442369B true CN115442369B (zh) 2023-06-16

Family

ID=84247597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211069146.2A Active CN115442369B (zh) 2022-09-02 2022-09-02 一种服务资源调度的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115442369B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107040407A (zh) * 2017-03-15 2017-08-11 成都中讯创新科技股份有限公司 一种高性能计算集群动态节点作业方法
CN108667654A (zh) * 2018-04-19 2018-10-16 北京奇艺世纪科技有限公司 服务器集群自动扩容方法及相关设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856512A (zh) * 2012-11-30 2014-06-11 华为技术有限公司 云计算的管理服务器、工作和闲置主机以及资源调度方法
CN108293009B (zh) * 2015-12-31 2021-05-18 华为技术有限公司 一种软件定义数据中心及其中的服务集群的调度方法
CN107231221B (zh) * 2016-03-25 2020-10-23 阿里巴巴集团控股有限公司 数据中心间的业务流量控制方法、装置及系统
US11328462B1 (en) * 2018-11-30 2022-05-10 United Services Automobile Association (Usaa) Visualization tool for server management and method of use
CN109697124A (zh) * 2018-12-12 2019-04-30 深圳店匠科技有限公司 高并发电商网站的网页数据采集方法、系统和介质
US11336739B1 (en) * 2020-12-23 2022-05-17 Salesforce.Com, Inc. Intent-based allocation of database connections
CN114928509B (zh) * 2022-05-25 2023-04-11 中国联合网络通信集团有限公司 一种宽带接入服务系统及其处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107040407A (zh) * 2017-03-15 2017-08-11 成都中讯创新科技股份有限公司 一种高性能计算集群动态节点作业方法
CN108667654A (zh) * 2018-04-19 2018-10-16 北京奇艺世纪科技有限公司 服务器集群自动扩容方法及相关设备

Also Published As

Publication number Publication date
CN115442369A (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
US20210255986A1 (en) Managing use of program execution capacity
US10114668B2 (en) Managing private use of program execution capacity
CN110858161B (zh) 资源分配方法、装置、系统、设备和介质
CN107291546B (zh) 一种资源调度方法及装置
US9929971B2 (en) Flexible-location reservations and pricing for network-accessible resource capacity
US8209695B1 (en) Reserving resources in a resource-on-demand system for user desktop utility demand
US8346909B2 (en) Method for supporting transaction and parallel application workloads across multiple domains based on service level agreements
RU2697700C2 (ru) Равноправное разделение системных ресурсов в исполнении рабочего процесса
US9246986B1 (en) Instance selection ordering policies for network-accessible resources
CN108154298B (zh) 配送任务分配方法、装置、电子设备及计算机存储介质
CN112988390A (zh) 一种算力资源分配方法及装置
CN111104227B (zh) 一种K8s平台的资源控制方法、装置及相关组件
CN112269641A (zh) 一种调度方法、装置、电子设备及存储介质
US11783237B2 (en) Dynamic modification of interruptibility settings for network-accessible resources
US10152449B1 (en) User-defined capacity reservation pools for network-accessible resources
CN110599148A (zh) 集群数据处理方法、装置、计算机集群及可读存储介质
CN106095581B (zh) 一种私有云条件下的网络存储虚拟化调度方法
CN114625533A (zh) 分布式任务调度方法、装置、电子设备及存储介质
CN112073532B (zh) 一种资源分配的方法及装置
CN115442369B (zh) 一种服务资源调度的方法、装置、存储介质及电子设备
CN111210256A (zh) 资源分配方法及其装置、服务器、存储介质
US10163152B1 (en) Notification of computing capacity status
CN111045819A (zh) 分布式系统的资源请求方法、装置、设备和存储介质
CN115051997A (zh) 分布式资源调度的方法及装置、存储介质、电子设备
CN114253663A (zh) 一种虚拟机资源的调度方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant