CN115098247A - 资源分配方法和装置 - Google Patents

资源分配方法和装置 Download PDF

Info

Publication number
CN115098247A
CN115098247A CN202210629029.0A CN202210629029A CN115098247A CN 115098247 A CN115098247 A CN 115098247A CN 202210629029 A CN202210629029 A CN 202210629029A CN 115098247 A CN115098247 A CN 115098247A
Authority
CN
China
Prior art keywords
application service
capacity
traffic
group
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210629029.0A
Other languages
English (en)
Inventor
王世宇
郑洋飞
雷磊
胡韵
廖聪
余航
孙银波
马琳涛
王世军
詹姆士·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210629029.0A priority Critical patent/CN115098247A/zh
Publication of CN115098247A publication Critical patent/CN115098247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Abstract

本说明书实施例提供了一种资源分配方法和装置。根据该实施例的方法,首先获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;然后对各应用服务的流量时间序列进行聚类,得到一个以上的分组;再分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。

Description

资源分配方法和装置
技术领域
本说明书一个或多个实施例涉及计算机应用技术领域,尤其涉及一种资源分配方法和装置。
背景技术
随着互联网的日益普及和用户数量的不断提升,应用系统访问量的爆炸式增长和访问的不确定性对应用服务的稳定性、伸缩性和可靠性带来了严峻的挑战。而大量的应用服务运行于各种资源上,包括计算、存储、通信等资源,通常称为容量资源。而这些容量资源是需要付出较高成本的,因此在实际环境中,如何对各种应用服务进行合理的资源分配成为亟待解决的问题。
发明内容
本说明书一个或多个实施例描述了一种资源分配方法和装置,用以实现针对应用服务的合理资源分配。
根据第一方面,提供了一种资源分配方法,包括:
获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;
对各应用服务的流量时间序列进行聚类,得到一个以上的分组;
分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。
在一个实施例中,在所述对各应用服务的流量时间序列进行聚类之前,还包括:对各应用服务的流量时间序列进行降维处理,得到各应用服务的流量向量组;
所述对各应用服务的流量时间序列进行聚类包括:基于各应用服务的流量向量组之间的距离进行聚类。
在另一个实施例中,所述分别针对各分组确定容量伸缩策略包括:
解析各分组的流量特性;
基于各分组的流量特性获取对应的容量伸缩策略。
在一个实施例中,所述流量特性至少包括以下至少一种:
分组的质心流量时间序列的流量均值和波动率。
根据第二方面,提供了一种资源分配方法,包括:
获取针对各分组确定的容量伸缩策略,所述分组是对各应用服务的流量时间序列进行聚类后得到的,所述流量时间序列包括连续多个时间点的流量数据;
依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
在一个实施例中,依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配包括:
获取应用服务在目标时间点的流量数据以及确定所述应用服务所在的分组对应的容量伸缩策略;
依据确定的容量伸缩策略,确定所述应用服务在目标时间点的流量数据对应的资源增加或缩减程度;
依据确定的资源增加或缩减程度,在所述目标时间点对分配给所述应用服务的容量资源进行相应的增加或缩减。
根据第三方面,提供了一种资源分配装置,包括:
序列获取单元,被配置为获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;
序列聚类单元,被配置对各应用服务的流量时间序列进行聚类,得到一个以上的分组;
策略确定单元,被配置为分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。
在一个实施例中,该装置还包括:
降维处理单元,被配置对各应用服务的流量时间序列进行降维处理,得到各应用服务的流量向量组;
所述序列聚类单元,具体被配置为基于各应用服务的流量向量组之间的距离进行聚类。
在另一个实施例中,所述策略确定单元,具体被配置为解析各分组的流量特性;基于各分组的流量特性获取对应的容量伸缩策略。
在一个实施例中,所述流量特性至少包括以下至少一种:
分组的质心流量时间序列的流量均值和波动率。
根据第四方面,提供了一种资源分配装置,包括:
策略获取单元,被配置为获取针对各分组确定的容量伸缩策略,所述分组是对各应用服务的流量时间序列进行聚类后得到的,所述流量时间序列包括连续多个时间点的流量数据;
容量伸缩单元,被配置为依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
在一个实施例中,所述容量伸缩单元,具体被配置为获取应用服务在目标时间点的流量数据以及确定所述应用服务所在的分组对应的容量伸缩策略;依据确定的容量伸缩策略,确定所述应用服务在目标时间点的流量数据对应的资源增加或缩减程度;依据确定的资源增加或缩减程度,在所述目标时间点对分配给所述应用服务的容量资源进行相应的增加或缩减。
根据第五方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
由以上技术方案可以看出,在本说明书实施例提供的方法和装置中,对应用服务的流量时间序列进行聚类,聚类得到的各分组能够刻画应用服务在流量特征上的关联性和相似性,从而能够针对各分组来确定精准地容量伸缩策略,实现针对应用服务的合理资源分配。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据一个实施例的资源分配方法的流程图;
图2示出了根据另一个实施例的资源分配方法的流程图;
图3示出了根据一个实施例的资源分配装置的示意性框图;
图4示出了根据另一个实施例的资源分配装置的示意性框图。
具体实施方式
容量伸缩是根据业务需求,通过设置容量伸缩策略来自动增加或缩减为应用服务分配的容量资源。在传统的实现方式中需要针对不同的应用服务分别人工设置容量伸缩策略。而在大规模系统中往往需要管理成千上万的应用服务的容量资源,这就需要人工维护大量的容量伸缩策略,人工成本过高。
有鉴于此,本说明书实施例提供了一种全新的方式来确定容量伸缩策略,图1示出根据一个实施例的资源分配方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图1所示,该方法包括:
步骤101,获取各应用服务的流量时间序列,流量时间序列包括连续多个时间点的流量数据。
步骤103,对各应用服务的流量时间序列进行聚类,得到一个以上的分组。
步骤105,分别针对各分组确定容量伸缩策略,容量伸缩策略用于分组对应的应用服务的容量资源分配。
在图1所示的方法中,对应用服务的流量时间序列进行聚类,聚类得到的各分组能够刻画应用服务在流量特征上的关联性和相似性,从而能够针对各分组来确定精准地容量伸缩策略,实现针对应用服务的合理资源分配。
并且,这种针对分组确定容量伸缩策略的方式,相比较针对各应用服务分配配置容量伸缩策略的方式,能够缩减管理和维护容量伸缩策略的成本。
下面描述图1所示的各个步骤的执行方式。首先结合实施例对上述步骤101即“获取各应用服务的流量时间序列”进行详细描述。
在本说明书实施例中,可以从历史流量数据中获取各应用服务的流量数据,然后获取各应用服务的流量时间序列。流量时间序列指的是将流量数据按照发生的时间顺序排列而成的数列。即流量时间序列包括连续T个时间点的流量数据,T为大于1的正整数。第i个应用服务的流量时间序列Fi可以表示为:Fi={f1,f2,…,fT}。
举个例子,对于应用程序的流量时间序列而言,每10秒统计应用程序的流量数据,那么就形成了每隔10秒一个流量数据的排列。假设1000秒的流量数据构成一个流量时间序列,一个流量时间序列中包含100个时间点的流量数据。
下面结合实施例对上述步骤103即“对各应用服务的流量时间序列进行聚类,得到一个以上的分组”进行详细描述。
在对各应用服务的流量时间序列进行聚类时,可以将各应用服务的流量时间序列分别看做是T维的向量组,然后对向量组进行聚类。
在进行聚类时可以基于向量组之间的距离进行聚类,距离越近说明应用服务的流量时间序列越相似。本说明书实施例并不对采用的具体聚类方法进行限制,任何能够对向量进行聚类的方式都可以采用,例如k-means聚类方法、密度聚类方法,等等。
在一些情况下,为了能够充分体现应用服务的流量特性,采用的流量时间序列的长度较长。在另外一些情况下,由于数据的限制,应用服务的流量时间序列中有效流量数据的长度不同,例如,有的应用服务有100个时间点的有效流量数据,有的应用服务有90个时间点的有效流量数据,等等。针对这些情况,为了较少计算量或弥补有效流量数据的长度不同的差异,在上述步骤101之后且步骤103之前,可以进一步对各应用服务的流量时间序列进行降维处理,得到各应用服务的流量向量组。这一降维处理所基于的原理是,如果两个时间序列在原始空间中相似,那么将其进行降维转换后在转换空间中的表示依然相似。
例如,可以将Fi={f1,f2,…,fT}进行降维处理,得到x维的流量向量组Fi':Fi'={f1',f2',…,fx'},其中,x为小于T的正整数。
其中,降维处理实际上就是对时间序列进行编码的过程,可以采用诸如PCA、Autoencoder(自编码器)等。PCA是一种数据分析方法,将原始数据变换成一组各维度线性无关的表示,可以用来提取主要特征,进而实现降维。自编码器包含编码器(encoder)和解码器(decoder)两部分,其初衷就是基于神经网络的降维问题而提出的学习算法,目前常被应用于从原始数据中提取特征表示,以实现降维。鉴于这些编码方法是目前比较成熟的技术,在此不做详述。
至此,若存在n个应用服务,那么这些应用服务的流量向量组就构成了数据集D:D={F1',F2',…,Fn'},也就是说,对该数据集D中的各流量向量组基于距离进行聚类,采用聚类方法将D划分为一个以上的分组,分组结果表示为C={C1,C2,…,Ck},其中,k为大于或等于1的正整数。其中,Cj表示聚类得到的一个分组。
下面结合实施例对上述步骤105即“分别针对各分组确定容量伸缩策略”进行详细描述。
由于分组是对各应用服务的流量时间序列进行聚类得到的,因此聚类得到的各分组体现了同一分组内各应用服务的相似流量特性。
作为一种可实现的方式,可以由专家根据专家经验人工针对各分组确定容量伸缩策略,也就是说,获取专家针对各分组确定的容量伸缩策略。
作为另一种可实现的方式,也可以分别解析各分组的流量特征,基于各分组的流量特性获取对应的容量伸缩策略。这种方式可以是根据各分组的流量特性自动生成容量伸缩策略。
其中,由于分组包含的是应用服务的流量时间序列,因此可以据此分析各分组的流量特性。例如,可以分析各分组的质心流量时间序列的流量均值、波动率等。针对每一个分组Cj,可以确定该分组Cj的质心,该质心实际上是一个流量时间序列,可以获取该流量时间序列的流量均值、波动率等指标来生成针对该分组Cj的容量伸缩策略。
在生成容量伸缩策略时,可以基于预先配置的规则实现。例如,可以预先配置各流量均值、波动率等流量特性对应的容量伸缩策略,在确定出各分组的流量特性后,依据该规则生成对应的容量伸缩策略。除此之外,也可以采用人工智能模型来实现容量伸缩策略的生成,即将分析出的流量特性输入人工智能模型,由人工智能模型自动生成该分组的容量伸缩策略。
若采用传统的实现方式,需要针对n个应用服务分别配置和维护容量伸缩策略,而采用本说明书实施例提供的方式,仅需要针对k个分组配置和维护容量伸缩策略。例如,存在1000个应用服务,但经过聚类后得到20个分组,则原本需要配置和维护1000个容量伸缩策略,现在缩小到配置和维护20个容量伸缩策略,很显然大大减小了管理和维护成本。
在得到容量伸缩策略之后,就可以将该容量伸缩策略部署到资源分配服务中,用于各分组对应的应用服务的容量资源分配。其中,图1所示的确定容量伸缩策略的方法可以由第一资源分配装置完成,第一资源分配装置将确定的容量伸缩策略配置于第二资源分配装置。第二资源分配装置是部署于资源分配服务的装置,用以执行具体的容量资源分配。上述第一资源分配装置和第二资源分配装置可以部署于独立的两个设备或集群中,也可以部署于同一个设备或集群中。第二资源装置执行的流程可以如图2中所示,包括以下步骤:
步骤201:获取针对各分组确定的容量伸缩策略,分组是对各应用服务的流量时间序列进行聚类后得到的,流量时间序列包括连续多个时间点的流量数据。
关于容量伸缩策略的确定过程可以参见图1所示实施例中的相关记载,在此不做赘述。本步骤中获取预先部署的各分组的容量伸缩策略。
步骤203:依据容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
容量伸缩策略实际上是如何自动增加或缩减应用服务的容量资源的策略,通常情况下是依据应用服务器在目标时间点的流量数据结合上述策略来确定出如何增加或缩减应用服务的。
作为一种可实现的方式,容量伸缩策略可以包含流量数据与容量资源的增加或缩减程度的对应关系。相应地在本步骤中,可以首先获取应用服务在目标时间点的流量数据以及确定应用服务所在的分组对应的容量伸缩策略;然后依据确定的容量伸缩策略,确定应用服务在目标时间点的流量数据对应的资源扩充或缩减程度;再依据确定的资源扩充或缩减程度,在目标时间点对分配给应用服务的容量资源进行相应的增加或缩减。
其中,上述目标时间点指的是需要对应用服务的容量资源进行调整的时间点,可以是当前时间点,也可以是未来的某一个时间点,例如下一个时间点。应用服务在目标时间点的流量数据可以是实际采集到的,也可以是通过人工智能模型预测得到的。
上述容量资源包括应用服务运行所需要的计算、存储、通信等资源。例如CPU、内存、网络带宽等。
举个例子,假设预先利用各应用服务的流量时间序列进行聚类后,确定出各分组的容量伸缩策略。其中应用服务1属于分组A,针对分组A配置的容量策略为a。
在线上进行容量资源的伸缩控制时,通过人工智能模型预测得到应用服务1在时间点t的流量数据,依据容量策略a以及该时间点t的流量数据,确定应用服务1在时间点t的资源扩充或缩减程度。然后依据该资源扩充或缩减程度,在时间点t对分配给应用服务1的容量资源进行相应的增加或缩减。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
根据另一方面的实施例,提供了一种资源分配装置。图3示出根据一个实施例的资源分配装置的示意性框图。可以理解,该装置可以通过任何具有计算、处理能力的装置、设备、平台和设备集群来实现。如图3所示,该装置300包括:序列获取单元301、序列聚类单元302和策略确定单元303,还可以进一步包括降维处理单元304。其中各组成单元的主要功能如下:
序列获取单元301,被配置为获取各应用服务的流量时间序列,流量时间序列包括连续多个时间点的流量数据。
序列聚类单元302,被配置对各应用服务的流量时间序列进行聚类,得到一个以上的分组。
策略确定单元303,被配置为分别针对各分组确定容量伸缩策略,容量伸缩策略用于分组对应的应用服务的容量资源分配。
作为一种优选的实施方式,降维处理单元304,被配置对各应用服务的流量时间序列进行降维处理,得到各应用服务的流量向量组。
相应地,序列聚类单元302,具体被配置为基于各应用服务的流量向量组之间的距离进行聚类。距离越近说明应用服务的流量时间序列越相似。本说明书实施例并不对采用的具体聚类方法进行限制,任何能够对向量进行聚类的方式都可以采用,例如k-means聚类方法、密度聚类方法,等等。
作为一种可实现的方式,可以由专家根据专家经验人工针对各分组确定容量伸缩策略,也就是说,策略确定单元303可以获取专家针对各分组确定的容量伸缩策略。
作为另一种可实现的方式,策略确定单元303,具体被配置为解析各分组的流量特性;基于各分组的流量特性获取对应的容量伸缩策略。这种方式可以是根据各分组的流量特性自动生成容量伸缩策略。
其中,流量特性至少包括以下至少一种:分组的质心流量时间序列的流量均值和波动率。
策略确定单元303在生成容量伸缩策略时,可以基于预先配置的规则实现。例如,可以预先配置各流量均值、波动率等流量特性对应的容量伸缩策略,在确定出各分组的流量特性后,依据该规则生成对应的容量伸缩策略。除此之外,策略确定单元303也可以采用人工智能模型来实现容量伸缩策略的生成,即将分析出的流量特性输入人工智能模型,由人工智能模型自动生成该分组的容量伸缩策略。
根据另一方面的实施例,提供了一种资源分配装置。图4示出根据一个实施例的资源分配装置的示意性框图。可以理解,该装置可以通过任何具有计算、处理能力的装置、设备、平台和设备集群来实现。如图4所示,该装置400包括:策略获取单元401和容量伸缩单元402。其中各组成单元的主要功能如下:
策略获取单元401,被配置为获取针对各分组确定的容量伸缩策略,分组是对各应用服务的流量时间序列进行聚类后得到的,流量时间序列包括连续多个时间点的流量数据。
容量伸缩单元402,被配置为依据容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
作为一种可实现的方式,容量伸缩单元402,具体被配置为获取应用服务在目标时间点的流量数据以及确定应用服务所在的分组对应的容量伸缩策略;依据确定的容量伸缩策略,确定应用服务在目标时间点的流量数据对应的资源增加或缩减程度;依据确定的资源增加或缩减程度,在目标时间点对分配给应用服务的容量资源进行相应的增加或缩减。
其中,上述应用服务在目标时间点的流量数据可以是实际采集到的,也可以是通过人工智能模型预测得到的。
图3中所示的资源分配装置用于确定各分组的容量伸缩策略,生成的容量伸缩策略配置于图4所示的资源分配装置,由图4所示的资源分配装置执行具体的容量资源分配和调整。图3和图4所示的资源分配装置可以部署于独立的两个设备或集群中,也可以部署于同一个设备或集群中。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行图1或图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现图1或图2所述的方法。
随着时间、技术的发展,计算机可读存储介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本说明书中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
上述的处理器可包括一个或多个单核处理器或多核处理器。处理器可包括任何一般用途处理器或专用处理器(如图像处理器、应用处理器基带处理器等)的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
另外需要说明的是,在本说明书实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于……”。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.资源分配方法,包括:
获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;
对各应用服务的流量时间序列进行聚类,得到一个以上的分组;
分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。
2.根据权利要求1所述的方法,其中,在所述对各应用服务的流量时间序列进行聚类之前,还包括:对各应用服务的流量时间序列进行降维处理,得到各应用服务的流量向量组;
所述对各应用服务的流量时间序列进行聚类包括:基于各应用服务的流量向量组之间的距离进行聚类。
3.根据权利要求1所述的方法,其中,所述分别针对各分组确定容量伸缩策略包括:
解析各分组的流量特性;
基于各分组的流量特性获取对应的容量伸缩策略。
4.根据权利要求3所述的方法,其中,所述流量特性至少包括以下至少一种:
分组的质心流量时间序列的流量均值和波动率。
5.资源分配方法,包括:
获取针对各分组确定的容量伸缩策略,所述分组是对各应用服务的流量时间序列进行聚类后得到的,所述流量时间序列包括连续多个时间点的流量数据;
依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
6.根据权利要求5所述的方法,其中,依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配包括:
获取应用服务在目标时间点的流量数据以及确定所述应用服务所在的分组对应的容量伸缩策略;
依据确定的容量伸缩策略,确定所述应用服务在目标时间点的流量数据对应的资源增加或缩减程度;
依据确定的资源增加或缩减程度,在所述目标时间点对分配给所述应用服务的容量资源进行相应的增加或缩减。
7.资源分配装置,包括:
序列获取单元,被配置为获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;
序列聚类单元,被配置对各应用服务的流量时间序列进行聚类,得到一个以上的分组;
策略确定单元,被配置为分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。
8.资源分配装置,包括:
策略获取单元,被配置为获取针对各分组确定的容量伸缩策略,所述分组是对各应用服务的流量时间序列进行聚类后得到的,所述流量时间序列包括连续多个时间点的流量数据;
容量伸缩单元,被配置为依据所述容量伸缩策略,调整各分组对应的应用服务的容量资源分配。
9.根据权利要求8所述的装置,其中,所述容量伸缩单元,具体被配置为获取应用服务在目标时间点的流量数据以及确定所述应用服务所在的分组对应的容量伸缩策略;依据确定的容量伸缩策略,确定所述应用服务在目标时间点的流量数据对应的资源增加或缩减程度;依据确定的资源增加或缩减程度,在所述目标时间点对分配给所述应用服务的容量资源进行相应的增加或缩减。
10.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-6中任一项所述的方法。
CN202210629029.0A 2022-06-06 2022-06-06 资源分配方法和装置 Pending CN115098247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210629029.0A CN115098247A (zh) 2022-06-06 2022-06-06 资源分配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210629029.0A CN115098247A (zh) 2022-06-06 2022-06-06 资源分配方法和装置

Publications (1)

Publication Number Publication Date
CN115098247A true CN115098247A (zh) 2022-09-23

Family

ID=83289891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210629029.0A Pending CN115098247A (zh) 2022-06-06 2022-06-06 资源分配方法和装置

Country Status (1)

Country Link
CN (1) CN115098247A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2336956A2 (en) * 2009-11-23 2011-06-22 Sap Ag Computer implemented methods for integrating services in a calendar application and computer implemented method for allocating drivers and passengers sharing a trip
US20130339079A1 (en) * 2012-06-15 2013-12-19 International Business Machines Corporation Configurable resource policies
US20190114213A1 (en) * 2016-06-20 2019-04-18 Alibaba Group Holding Limited Streaming data distributed processing method and device
CN112052284A (zh) * 2020-08-26 2020-12-08 南京越扬科技有限公司 一种大数据下的主数据管理方法及系统
CN112486642A (zh) * 2020-11-25 2021-03-12 广州虎牙科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
US20210294664A1 (en) * 2020-06-05 2021-09-23 Baidu Online Network Technology (Beijing) Co., Ltd. Resource processing method and apparatus, and storage medium
CN114219024A (zh) * 2021-12-14 2022-03-22 中国科学院计算机网络信息中心 一种网络边缘的应用级流量预测与模型迁移方法
CN114237896A (zh) * 2021-12-20 2022-03-25 中国工商银行股份有限公司 分布式节点资源动态调度方法及装置
CN114553723A (zh) * 2022-03-30 2022-05-27 苏州浪潮智能科技有限公司 一种人工智能训练平台的运营方法、系统、介质及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2336956A2 (en) * 2009-11-23 2011-06-22 Sap Ag Computer implemented methods for integrating services in a calendar application and computer implemented method for allocating drivers and passengers sharing a trip
US20130339079A1 (en) * 2012-06-15 2013-12-19 International Business Machines Corporation Configurable resource policies
US20190114213A1 (en) * 2016-06-20 2019-04-18 Alibaba Group Holding Limited Streaming data distributed processing method and device
US20210294664A1 (en) * 2020-06-05 2021-09-23 Baidu Online Network Technology (Beijing) Co., Ltd. Resource processing method and apparatus, and storage medium
CN112052284A (zh) * 2020-08-26 2020-12-08 南京越扬科技有限公司 一种大数据下的主数据管理方法及系统
CN112486642A (zh) * 2020-11-25 2021-03-12 广州虎牙科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN114219024A (zh) * 2021-12-14 2022-03-22 中国科学院计算机网络信息中心 一种网络边缘的应用级流量预测与模型迁移方法
CN114237896A (zh) * 2021-12-20 2022-03-25 中国工商银行股份有限公司 分布式节点资源动态调度方法及装置
CN114553723A (zh) * 2022-03-30 2022-05-27 苏州浪潮智能科技有限公司 一种人工智能训练平台的运营方法、系统、介质及设备

Similar Documents

Publication Publication Date Title
US10460241B2 (en) Server and cloud computing resource optimization method thereof for cloud big data computing architecture
US8676621B1 (en) System and method for managing requests for pooled resources during non-contention
CN110069341B (zh) 边缘计算中结合功能按需配置的有依赖关系任务的调度方法
CN107846371B (zh) 一种多媒体业务QoE资源分配方法
CN111324533B (zh) A/b测试方法、装置及电子设备
CN111782386A (zh) 一种基于历史业务流量的数据库调度方法及系统
CN112165436A (zh) 流量控制方法、装置及系统
KR101630125B1 (ko) 클라우드 컴퓨팅 자원관리 시스템에서의 자원 요구량 예측 방법
CN114675933A (zh) 一种容器集群调度方法、装置、设备、存储介质
CN115080248B (zh) 调度装置的调度优化方法、调度装置和存储介质
CN114860462B (zh) 双路机架式服务器的计算资源智能分配系统及其分配方法
CN111431996A (zh) 用于资源配置的方法、装置、设备和介质
CN112488563B (zh) 一种算力参数的确定方法和装置
CN115098247A (zh) 资源分配方法和装置
KR102516412B1 (ko) 기계학습 추론을 위한 gpu 클럭 조절 방법 및 장치
CN114816700A (zh) 数据采集方法、装置、设备及存储介质
US20230060623A1 (en) Network improvement with reinforcement learning
CN111901410A (zh) 一种服务器分组方法、装置、设备及计算机可读存储介质
JP7013569B2 (ja) コンテンツ要求に応答する際のコンピューティングリソースの効率的な使用
KR20170126587A (ko) 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치
CN112686374A (zh) 基于自适应负载分配的深度神经网络模型协同推理方法
CN113760484A (zh) 数据处理的方法和装置
CN117081996B (zh) 基于服务端实时反馈和软阈值的流量控制方法及相关设备
CN115379014B (zh) 数据请求分发方法、装置,以及,电子设备
CN110602569B (zh) 一种基于带宽趋势的带宽复用方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination