CN111913780A - 云计算中的资源预测与调度方法 - Google Patents

云计算中的资源预测与调度方法 Download PDF

Info

Publication number
CN111913780A
CN111913780A CN202010679044.7A CN202010679044A CN111913780A CN 111913780 A CN111913780 A CN 111913780A CN 202010679044 A CN202010679044 A CN 202010679044A CN 111913780 A CN111913780 A CN 111913780A
Authority
CN
China
Prior art keywords
predicted value
resource
virtual machine
resource demand
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010679044.7A
Other languages
English (en)
Other versions
CN111913780B (zh
Inventor
陈志佳
孟宪国
朱元昌
邸彦强
冯少冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN202010679044.7A priority Critical patent/CN111913780B/zh
Publication of CN111913780A publication Critical patent/CN111913780A/zh
Application granted granted Critical
Publication of CN111913780B publication Critical patent/CN111913780B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种云计算中的资源预测与调度方法,包括以下步骤:S10:根据资源需求历史数据对至少一个虚拟机进行下一时刻的资源需求预测;S20:根据资源需求预测值,对服务器上配置给所述虚拟机的资源进行动态调度。

Description

云计算中的资源预测与调度方法
技术领域
本发明涉及计算机技术领域,具体涉及一种云计算中的资源预测与调度方法。
背景技术
IaaS模式云训练中,根据虚拟机节点资源需求为其合理分配资源,既保证了虚拟机的性能,又能提升资源利用效率。由于虚拟机实例的初始化需要一定准备时间,无法即时生效,因此仅仅依靠对虚拟机任务负载和资源性能的监控对虚拟机资源进行调度,难以保证虚拟机节点的性能。因此,有必要进行精确有效的资源需求预测,在此基础上再进行资源的调度,实现用户需求与资源之间的优化调度与匹配。
发明内容
鉴于上述技术问题,为了克服上述现有技术的不足,本发明提出了一种云计算中的资源预测与调度方法。
本发明一方面提供一种云计算中的资源预测与调度方法,包括以下步骤:S10:根据资源需求历史数据对至少一个虚拟机进行下一时刻的资源需求预测;S20:根据资源需求的预测值,对服务器上配置给所述虚拟机的资源进行动态调度。
在一些实施例中,步骤S10包括以下步骤:S101:采用数据预处理模型对所述虚拟机进行资源需求预测获得第1预测值;S102:采用深度学习网络模型对所述虚拟机进行资源需求预测获得第2预测值;S103:对各第1预测值和第2预测值进行权重处理后叠加,获得综合预测值。
在一些实施例中,所述数据预处理模型的预测值为xt+1=ωR(t,L)+(1-ω)xt,其中,xt+1为t+1时刻的预测值,L为滑窗长度,R(t,L)为[t-(L-1),t]之间历史数据的移动平均值,ω为赋权系数,且ω=2/(L+1)。
在一些实施例中,所述深度学习网络模型包括多层BP神经网络,所述多层BP神经网络的传递函数为:
Figure BDA0002584990310000021
其中β为调整系数,x为输入变量。
在一些实施例中,第t时刻的综合预测值为
Figure BDA0002584990310000022
其中,
Figure BDA0002584990310000023
为第t时刻的第i预测值,i=1或2,
Figure BDA0002584990310000024
为第t时刻的第丁预测值对应的权重。
在一些实施例中,
Figure BDA0002584990310000025
Figure BDA0002584990310000026
通过如下两式联立获得:
Figure BDA0002584990310000027
Figure BDA0002584990310000028
其中,
Figure BDA0002584990310000029
为第t-1时刻第j预测值的相对误差,j=1或2,
Figure BDA00025849903100000210
为中间变量。
在一些实施例中,步骤S20包括以下步骤:S201:获取所述虚拟机当前资源配置Ri,S202:根据所述资源需求的预测值为所述虚拟机动态配置资源
Figure BDA0002584990310000031
其中,
Figure BDA0002584990310000032
表示资源需求预测值,a为资源调节量。
在一些实施例中,
Figure BDA0002584990310000033
Rmin为所述虚拟机能够正常运行所需的最小资源配置,Rmax为所述服务器中能为虚拟机提供的资源的最大值。
附图说明
图1为本发明一实施例提供的云计算中的资源预测与调度方法的流程图;
图2为图1中步骤S10的具体步骤流程图;
图3为图1中步骤S20的具体步骤流程图。
具体实施方式
本发明某些实施例于后方将参照所附附图做更全面性地描述,其中一些但并非全部的实施例将被示出。实际上,本发明的各种实施例可以许多不同形式实现,而不应被解释为限于此数所阐述的实施例;相对地,提供这些实施例使得本发明满足适用的法律要求。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
当前,由于虚拟机实例的初始化需要一定准备时间,无法即时生效,因此仅仅依靠对虚拟机任务负载和资源性能的监控对虚拟机资源进行调度,难以保证虚拟机节点的性能。
本发明提供一种云计算中的资源预测与调度方法,基于数据预处理及深度学习网络等预测模型,对预测值进行综合,得到用户资源需求综合预测值。综合服务器端资源特点与用户端需求特点,依据预测值,实现用户需求与资源之间的优化调度与匹配。
本发明一实施例提供一种云计算中的资源预测与调度方法,先对虚拟机进行精确有效的资源需求预测,在此基础上再进行资源的调度,实现用户需求与资源之间的优化调度与匹配。
如图1所示,本公开提供的一种云计算中的资源预测与调度方法包括以下步骤:
S10:根据资源需求历史数据对至少一个虚拟机进行下一时刻的资源需求预测;
S20:根据资源需求的预测值,对服务器上配置给所述虚拟机的资源进行动态调度。
本实施例中,虚拟机资源包括虚拟机的CPU、GPU、内存、网络带宽、存储等。根据资源需求历史数据,采用预测算法实现用户虚拟机资源需求的预测。通过资源监控系统实时监控用户虚拟机的资源利用情况,动态调整各用户虚拟机的资源配置,改善虚拟机的性能,提升资源利用率。通过采用反馈控制的方式,将调整参数反馈至监控中心,从而不断优化迭代上述模型,达到有效提升云训练服务质量的目的。
如图2所示,前述步骤S10包括以下具体步骤:
S101:采用数据预处理模型对所述虚拟机进行资源需求预测获得第1预测值;
S102:采用深度学习网络模型对所述虚拟机进行资源需求预测获得第2预测值;
S103:对各第1预测值和第2预测值进行权重处理后叠加,获得综合预测值。
本实施例中,针对数据的变化性和不确定性,步骤S101中数据预处理模型可以选择单步迭代加权预处理方法。所述数据预处理模型的预测值xt+1(即第1预测值)是用户需求的历史数据序列x及滑窗长度L的因变量,滑窗长度L为历史数据序列长度,即包含L个历史数据,可表示为
xt+1=f(X,L) (1)
具体表达式如下:
xt+1=ωR(t,L)+(1-ω)xt (2)
其中,xt+1为t+1时刻的预测值,L为滑窗长度,R(t,L)为[t-(L-1),t]之间历史数据的移动平均值,ω为加权系数,且ω=2/(L+1)。
监控系统实时监控用户配置的虚拟机资源。如果监控数据向上穿越移动平均值,则表明资源需求值将会产生一个上升趋势。如果监控数据向下穿越移动平均值,则表明资源需求值将会出现下降趋势。
本实施例中,步骤S102中所述深度学习网络模型是以多层BP神经网络为基础,包含输入层、输出层和隐层。通常来说,神经网络的传递函数f(x)选取sigmoid函数:
Figure BDA0002584990310000051
传递函数输出值f(x)∈(0,1),其中靠近0或者1的区域称为饱和区,远离0和1的区域为非饱和区。在饱和区内,因变量对自变量的变化不敏感,导致权重无法进行有效地修正。如果当前输出值不够理想且处于饱和区,则网络输出值难以调整至最优值,从而影响到收敛速度和预测性能。
为了提高预测性能,传递函数需要进行修正以优化网络输出值。修正方式通常主要通过两个方式进行改进。方式一是调整sigmoid函数饱和区控制参数,方式二是引入新函数组合的方式进行优化。
具体地,方式一如下所示:
在sigmoid函数中,指数部分为控制饱和区大小的关键,修改形式如下:
Figure BDA0002584990310000061
将β值调整至0.2,即可降低饱和区区间,但是不能降低过多,否则会导致变化率过小,饱和区和非饱和区界限不够明显。
方式二如下所示:
若采用线性整流函数弥补该缺陷,线性整流函数表达式为:
f(x)=maX(0,x) (5)
该函数在自变量大于0时可解决sigmoid函数饱和问题,但是在自变量小于0时因变量始终为0,也就是说该函数输出值全部为0或者正值,从而导致偏置性越来越大。
本实施例采用上述二种方式,并进行优化组合,提出sigmoid-线性传递函数组合方案,优化组合后的神经网络的传递函数为:
Figure BDA0002584990310000062
其中β为调整系数,x为输入变量,例如为神经元的输入。
通过该改进方式,首先减少了非线性传递函数的解算工作量,解算时间短,非线性函数解算工作量大幅降低;其次,降低了BP神经网络传递函数饱和区输出值难以调整的概率;最后,在一定程度上降低和抵消了仅采用线性整流函数时解算结果的偏置程度,精度有一定提升。
本实施例中,步骤S103中采用可变权重的方式进行各预测模型结果的处理,设在第t时刻第i(i=1,2)预测模型的预测值为
Figure BDA0002584990310000071
其对应权重为
Figure BDA0002584990310000072
且满足
Figure BDA0002584990310000073
通过对上述预测值进行赋权,第t时刻的综合预测值为
Figure BDA0002584990310000074
其中,
Figure BDA0002584990310000075
为第t时刻的第i预测值,i=1或2,第1和2预测值分别表示数据预处理模型及深度学习网络模型的预测值,
Figure BDA0002584990310000076
为第t时刻的第i预测值对应的权重。
权重的初始化值为0.5,即各预测模型初始化权重相等。更新权重时,通过各个预测模型的相对误差
Figure BDA0002584990310000077
决定下一时刻的权重值,第i预测模型的相邻时刻权重
Figure BDA0002584990310000078
Figure BDA0002584990310000079
通过如下两式联立获得:
Figure BDA00025849903100000710
Figure BDA00025849903100000711
其中,
Figure BDA00025849903100000712
为第t-1时刻第j预测值的相对误差,j=1或2,
Figure BDA00025849903100000713
为中间变量。
通过该权重模型保证预测精度高的预测模型分配较高权重,而预测精度低的预测模型分配较低权重,实现资源的优化配置。
如图3所示,所述步骤S20具体包括以下步骤:
S201:获取第i虚拟机当前资源配置量Ri
S202:根据所述资源需求的预测值为所述虚拟机动态配置资源:
Figure BDA0002584990310000081
其中,
Figure BDA0002584990310000082
表示资源需求的预测值,ai为资源调节量。
本实施例中,在步骤S201中,根据用户资源需求的预测值,对虚拟训练资源进行动态调度。首先根据监控获取各训练用户的虚拟机编号i,调度器读取该虚拟机当前资源配置量Ri,其中Ri={chi,cni,mi,gi,bi},chi表示虚拟CPU频率,cni表示虚拟CPU核数,mi表示虚拟内存,gi表示虚拟GPU显存,bi表示虚拟网络带宽。
在步骤S202中,根据资源需求预测值
Figure BDA0002584990310000083
其中
Figure BDA0002584990310000084
调度器为第i虚拟机动态配置资源ΔRi
资源调节量ai为用来保证第i虚拟机配置资源为合理值,避免出现小数以及不符合实际应用的数值。式(10)中,若ARi为正值,表示该虚拟机资源需要增加;若ΔRi为负值,表示该虚拟机资源需要减少。同时,为了避免由于预测错误造成的虚拟机宕机,影响训练任务的执行,对资源预测值
Figure BDA0002584990310000085
进行硬限幅:
Figure BDA0002584990310000086
Figure BDA0002584990310000091
其中,Rmin={chmin,cnmin,mmin,gmin,bmin}为虚拟机能够正常运行所需的最小资源配置,Rmax={Chmax,Cnmax,Mmax,Gmax,Bmax}为相应服务器为所述虚拟机提供的资源的最大值。Rmin的各分项为虚拟CPU频率、虚拟CPU核数、虚拟内存、虚拟GPU显存和虚拟网络带宽能够正常运行所需的最小资源配置,Rmax的各分项为相应服务器能为虚拟CPU频率、虚拟CPU核数、虚拟内存、虚拟GPU显存和虚拟网络带宽所提供的资源的最大值。
资源调度完毕后,对此次配置进行记录,包括训练任务Ti、当前资源Ri、资源预测值
Figure BDA0002584990310000092
配置后资源
Figure BDA0002584990310000093
当前虚拟机性能Pi、配置后虚拟机性能
Figure BDA0002584990310000094
计算训练任务与资源性能、数量之间的关系,最后将相关数据存储到历史记录中。
应注意,附图中各部件的形状和尺寸不反映真实大小和比例,而仅示意本发明实施例的内容。
实施例中提到的方向用语,例如“上”、“下”、“前”、“后”、“左”、“右”等,仅是参考附图的方向,并非用来限制本发明的保护范围。并且上述实施例可基于设计及可靠度的考虑,彼此混合搭配使用或与其他实施例混合搭配使用,即不同实施例中的技术特征可以自由组合形成更多的实施例。
实施例中涉及的方法步骤并不限于其描述的顺序,各步骤的顺序根据实际需要的来进行调整。
需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种云计算中的资源预测与调度方法,其特征在于,包括以下步骤:
S10:根据资源需求历史数据对至少一个虚拟机进行下一时刻的资源需求预测;
S20:根据资源需求预测值,对服务器上配置给所述虚拟机的资源进行动态调度。
2.根据权利要求1所述的资源预测与调度方法,其特征在于,步骤S10包括以下步骤:
S101:采用数据预处理模型对所述虚拟机进行资源需求预测获得第1预测值;
S102:采用深度学习网络模型对所述虚拟机进行资源需求预测获得第2预测值;
S103:对各第1预测值和第2预测值进行权重处理后叠加,获得综合预测值。
3.根据权利要求2所述的资源预测与调度方法,其特征在于,所述数据预处理模型为xt+1=ωR(t,L)+(1-ω)xt,其中,xt+1为t+1时刻的预测值,L为滑窗长度,R(t,L)为[t-(L-1),t]之间历史数据的移动平均值,ω为赋权系数,且ω=2/(L+1)。
4.根据权利要求2所述的资源预测与调度方法,其特征在于,所述深度学习网络模型包括多层BP神经网络,所述多层BP神经网络的传递函数为:
Figure FDA0002584990300000021
其中β为调整系数,x为输入变量。
5.根据权利要求2所述的资源预测与调度方法,其特征在于,
第t时刻的综合预测值为
Figure FDA0002584990300000022
其中,
Figure FDA0002584990300000023
为第t时刻的第i预测值,i=1或2,
Figure FDA0002584990300000024
为第t时刻的第i预测值对应的权重。
6.根据权利要求5所述的资源预测与调度方法,其特征在于,
Figure FDA0002584990300000025
Figure FDA0002584990300000026
通过如下两式联立获得:
Figure FDA0002584990300000027
Figure FDA0002584990300000028
其中,
Figure FDA0002584990300000029
为第t-1时刻第j预测值的相对误差,j=1或2,
Figure FDA00025849903000000210
为中间变量。
7.根据权利要求1所述的资源预测与调度方法,其特征在于,步骤S20包括以下步骤:
S201:获取所述虚拟机当前资源配置R,
S202:根据所述资源需求的预测值为所述虚拟机动态配置资源
Figure FDA0002584990300000031
其中,
Figure FDA0002584990300000032
表示资源需求预测值,a为资源调节量。
8.根据权利要求7所述的资源预测与调度方法,其特征在于,
Figure FDA0002584990300000033
Rmin为所述虚拟机能够正常运行所需的最小资源配置,Rmax为所述服务器能为虚拟机提供的资源的最大值。
CN202010679044.7A 2020-07-15 2020-07-15 云计算中的资源预测与调度方法 Active CN111913780B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010679044.7A CN111913780B (zh) 2020-07-15 2020-07-15 云计算中的资源预测与调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010679044.7A CN111913780B (zh) 2020-07-15 2020-07-15 云计算中的资源预测与调度方法

Publications (2)

Publication Number Publication Date
CN111913780A true CN111913780A (zh) 2020-11-10
CN111913780B CN111913780B (zh) 2022-01-11

Family

ID=73280959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010679044.7A Active CN111913780B (zh) 2020-07-15 2020-07-15 云计算中的资源预测与调度方法

Country Status (1)

Country Link
CN (1) CN111913780B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113900827A (zh) * 2021-12-08 2022-01-07 北京广通优云科技股份有限公司 一种智能运维系统中基于多因素关联的内存调整预测方法
CN117952669A (zh) * 2024-03-27 2024-04-30 深圳威尔视觉科技有限公司 基于深度学习的算力需求预测方法、装置及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120246638A1 (en) * 2011-03-22 2012-09-27 International Business Machines Corporation Forecasting based service assignment in cloud computing
CN103945548A (zh) * 2014-04-29 2014-07-23 西安电子科技大学 一种c-ran网络中的资源分配系统及任务/业务调度方法
CN105302632A (zh) * 2015-11-19 2016-02-03 国家电网公司 一种云计算工作负载动态整合方法
CN106933649A (zh) * 2016-12-21 2017-07-07 华南师范大学 基于移动平均和神经网络的虚拟机负载预测方法及系统
CN107045455A (zh) * 2017-06-19 2017-08-15 华中科技大学 一种基于负载预测的Docker Swarm集群资源调度优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120246638A1 (en) * 2011-03-22 2012-09-27 International Business Machines Corporation Forecasting based service assignment in cloud computing
CN103945548A (zh) * 2014-04-29 2014-07-23 西安电子科技大学 一种c-ran网络中的资源分配系统及任务/业务调度方法
CN105302632A (zh) * 2015-11-19 2016-02-03 国家电网公司 一种云计算工作负载动态整合方法
CN106933649A (zh) * 2016-12-21 2017-07-07 华南师范大学 基于移动平均和神经网络的虚拟机负载预测方法及系统
CN107045455A (zh) * 2017-06-19 2017-08-15 华中科技大学 一种基于负载预测的Docker Swarm集群资源调度优化方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
冯少冲等: "IaaS云计算中虚拟机部署算法研究", 《华中科技大学学报(自然科学版)》 *
徐克虎等: "《智能计算方法及应用》", 31 July 2019 *
朱元昌等: "IaaS模式"云训练"资源预测-调度方法", 《系统工程与电子技术》 *
陈志佳等: "一种IaaS模式"云训练"系统设计", 《系统仿真学报》 *
陈志佳等: "基于改进神经网络的IaaS云资源需求预测方法", 《华中科技大学学报(自然科学版)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113900827A (zh) * 2021-12-08 2022-01-07 北京广通优云科技股份有限公司 一种智能运维系统中基于多因素关联的内存调整预测方法
CN113900827B (zh) * 2021-12-08 2022-03-15 北京广通优云科技股份有限公司 一种智能运维系统中基于多因素关联的内存调整预测方法
CN117952669A (zh) * 2024-03-27 2024-04-30 深圳威尔视觉科技有限公司 基于深度学习的算力需求预测方法、装置及计算机设备
CN117952669B (zh) * 2024-03-27 2024-07-05 深圳威尔视觉科技有限公司 基于深度学习的算力需求预测方法、装置及计算机设备

Also Published As

Publication number Publication date
CN111913780B (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
CN111953758B (zh) 一种边缘网络计算卸载和任务迁移方法及装置
CN112860350A (zh) 一种边缘计算中基于任务缓存的计算卸载方法
CN109324875B (zh) 一种基于强化学习的数据中心服务器功耗管理与优化方法
US11784931B2 (en) Network burst load evacuation method for edge servers
CN113191484A (zh) 基于深度强化学习的联邦学习客户端智能选取方法及系统
CN113778648A (zh) 分层边缘计算环境中基于深度强化学习的任务调度方法
CN111913780B (zh) 云计算中的资源预测与调度方法
Dong et al. Joint optimization with DNN partitioning and resource allocation in mobile edge computing
CN111262944B (zh) 异构移动边缘计算网络中分层任务卸载的方法与系统
CN104951425A (zh) 一种基于深度学习的云服务性能自适应动作类型选择方法
CN109960573B (zh) 一种基于智能感知的跨域计算任务调度方法及系统
CN104239141A (zh) 数据中心中基于工作流关键路径的任务优化调度方法
CN116680062B (zh) 一种基于大数据集群的应用调度部署方法及存储介质
CN115934333A (zh) 基于历史数据感知的云计算资源调度方法及调度系统
CN114585006B (zh) 基于深度学习的边缘计算任务卸载和资源分配方法
Cheng et al. Proscale: Proactive autoscaling for microservice with time-varying workload at the edge
Uma et al. Optimized intellectual resource scheduling using deep reinforcement Q‐learning in cloud computing
CN115714820A (zh) 一种分布式的微服务调度优化方法
Song et al. Adaptive and collaborative edge inference in task stream with latency constraint
Ma et al. Dynamic neural network-based resource management for mobile edge computing in 6g networks
CN112036707B (zh) 面向时间不确定生产过程协同的节拍控制方法和系统
CN117950860A (zh) 一种面向算网融合的云边资源协同调度方法及系统
CN117202264A (zh) Mec环境中面向5g网络切片的计算卸载方法
CN109324953B (zh) 一种虚拟机能耗预测方法
Liu et al. Multi-objective robust workflow offloading in edge-to-cloud continuum

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant