CN112631750B - 面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 - Google Patents
面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 Download PDFInfo
- Publication number
- CN112631750B CN112631750B CN202011521067.1A CN202011521067A CN112631750B CN 112631750 B CN112631750 B CN 112631750B CN 202011521067 A CN202011521067 A CN 202011521067A CN 112631750 B CN112631750 B CN 112631750B
- Authority
- CN
- China
- Prior art keywords
- resource information
- data center
- online
- cloud data
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000005070 sampling Methods 0.000 claims abstract description 16
- 238000011084 recovery Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法。包括以下步骤:S1.从云数据中心获取特定时间段内各服务器中在线服务器的资源信息;S2.分析资源信息的数据特征,基于压缩感知的方法对资源信息进行抽样和压缩;S3.调度器获取压缩后的资源信息进行恢复,并将其作为LSTM模型的输入来预测下一时间段在线服务器的资源使用信息;S4.从云数据中心获取下一时间段内将要处理的批处理作业调度需求的资源信息;S5.结合当前在线服务器可用资源信息和批处理作业调度所需的资源信息,构建基于cMAB的在线学习模型,来对批作业进行调度。能大幅提升调度效率和云数据中心的资源利用率。
Description
技术领域
本发明涉及压缩感知,在线学习和云计算领域,更具体地,涉及一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法。
背景技术
为了云数据中心资源传输带来的网络拥塞问题,现有的一些工作使用随机抽样的方法来缓解资源信息数据传输的压力,但这种方法可能会导致云资源感知不准确。其他方法如使用恢复模型并采用统计估算的方法在随机抽样后重建全部资源信息数据,如专利CN111782627A,公开日为2020.10.16,公开了一种面向广域高性能计算环境的任务与数据协同调度方法;然而,这些模型通常忽略了云资源信息数据中复杂的潜在关系。还有其他的一些方法通过回归方法来利用关联性,但是它们需要手动选择相关属性并假设已知的数据样本分布,这在复杂的真实数据中心几乎是不可能获得的,没有太大的实用性和应用价值。而当前比较流行的深度学习模型通常对云资源信息有很好的恢复效果,但它们需要大量的计算资源,并且需要耗费较长的时间来进行模型的训练和预测。
为了保证令人满意的在线服务性能,需要高效的细粒度调度方法。在之前的研究中,有许多启发式算法如公平调度、首次拟合和装箱策略。这些算法简单直观,但对于在线服务和批处理作业的混合部署可能效率低下。其他算法如减少持续时间和完成时间的和旨在避免浪费调度过程中产生的能源消耗,都是根据不同的目标来优化调度过程。然而,上面提到的方法仅考虑静态资源和用户需求,因此很难满足现实云数据中心中呈现的高资源动态性和任务到达的随机性这两个重要的特性。
发明内容
本发明为克服上述现有技术中的至少一个缺陷,提供一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,能大幅提升调度效率和云数据中心的资源利用率。
为解决上述技术问题,本发明采用的技术方案是:一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,包括以下步骤:
S1.从云数据中心获取特定时间段内各服务器中在线服务器的资源信息;
S2.分析资源信息的数据特征,基于压缩感知的方法对资源信息进行抽样和压缩;
S3.调度器获取压缩后的资源信息进行恢复,并将其作为LSTM模型的输入来预测下一时间段在线服务器的资源使用信息;
S4.从云数据中心获取下一时间段内将要处理的批处理作业调度需求的资源信息;
S5.结合当前在线服务器可用资源信息和批处理作业调度所需的资源信息,构建基于cMAB的在线学习模型,来对批作业进行调度。
在本发明公开的一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,是一种利用在线服务信息主动调度批处理作业的新方法,同时它是一个带宽高效的混合任务部署框架,通过对真实环境中的在线服务资源状态数据进行深入分析,发现了其具有低秩的特征,其中有些资源如CPU利用率还有较强的时间关联性,因此可以使用压缩感知的方法对在线服务的资源信息进行压缩,从而能够缓解云数据中心的网络拥塞,并且减少了系统的开销。
为了主动缓解在线服务和批处理作业混合部署带来的资源冲突,本发明利用了长短期记忆模型LSTM来对在线服务的下一阶段需求进行预测,但由于在线服务具有资源请求波动大的特点,因此使用LSTM来预测的资源需求与实际情况往往会产生偏差,所以本发明在此基础上为在线服务需求预留了一个最大值,以应对需求洪峰的出现,有效防止了在线服务的需求波动对批处理作业调度性能的影响。另外,本发明使用基于上下文相关的多臂老虎机模型cMAB,提出了一种有效的在线学习模型,将当前系统的资源利用率作为模型的激励机制,所以能很好地适应云数据中心环境动态变化的特点,比基于深度强化学习的方法更加轻量级,能大幅提升调度效率和云数据中心的资源利用率。
进一步的,所述的步骤S2中,分析资源信息的数据特征包括是否具有矩阵重构的低秩特征和时间关联性,以此判断是否可以使用压缩感知的方法以及是否可以利用时间关联性来协助恢复CPU资源信息的重建过程。
进一步的,利用奇异值分解的方法确定矩阵是否低秩;具体步骤包括:假设一个奇异矩阵σi代表奇异矩阵对角线上的元素,如果存在一个r,使得满足公式(1),那么则证明这个矩阵是低秩的:
r<<min(n,m) (1)
进一步的,判断是否具有时间关联性的步骤包括:假设xi,j代表在t时间上第i台服务器的资源信息,以下公式(2)通过Δxi,j来表示时间关联性:
进一步的,所述的步骤S2中,基于压缩感知的方法对资源信息进行抽样和压缩具体包括以下步骤:
S21.对云数据中心的资源信息进行建模,定义代表在时间t上所有n个服务器的资源信息,/>则为一个二值指标,取1代表在该服务器上进行抽样,取0代表未在该服务器上进行采样,那么当前抽样得到的在线服务资源信息就可以表示为这两者的点积,用ht来表示ht=bt·xt;
S22.定义代表在T时间段内在线服务的总资源信息,/>表示恢复的结果,B为二值指标bt对应的矩阵,那么数据重构的问题就可以转化为以下目标函数的优化问题,如公式(3):
S23.进一步通过奇异值分解SVD方法将此优化目标进行求解,因此优化问题可以转化为以下表示形式:
S24.为了求解(4)中这个带约束的优化问题,采用拉格朗日乘子法对此问题进行求解:
在公式(5)中,拉格朗日参数λ是可以调节约束和秩最小化折衷的控制参数;
S25.CPU资源信息跟时间有较强的关联性,所以在对CPU资源信息恢复的过程中从时间维度上进行求解,这里利用关于时间T的托普利兹矩阵最终的目标函数为:
其中,公式(6)中的为时间关系项。
进一步的,为了应对出现资源需求出现洪峰的情况,在通过长短期记忆模型LSTM预测下一阶段的在线服务需求信息后,再增加一个预测需求值
进一步的,在下一个周期{T1,…,Tf}中,假设预测结果为其中f是周期的长度,对于每台云服务器i∈{1,…,n},需要选择一个特殊的预测需求pi,k满足以下条件:
pi,k≥95%of max(pi,k),k∈{T1,…,Tf} (7)
当选择了一个合适的pi,k值后,将其扩展到当前时间段内资源的预测需求值假设/>为云数据中心资源信息的原始值,那么用于下一时间段内批处理作业调度的可用资源U就可以表示为:
进一步的,所述的步骤S5中构建基于cMAB的在线学习模型具体包括:给定可用CPU资源Uc和可用内存资源Um,在特定的时间t,当批处理作业ht到达时,并且它对CPU和内存的需求分别为Yc和Ym,那么n(Yc,Ym,Uc,Um)定义为满足批处理作业调度需求资源的次数,用Y来表示,μ(Y)则表示其期望值,那么最终的在线学习模型可以表示为:
I(Y)=μ(Y)+R(Y) (9)
式中,代表的是在线学习模型的置信半径。
与现有技术相比,有益效果是:
1.本发明通过对在实际生产环境中的数据集进行深入分析,发现在线服务资源信息在真实环境中具有低秩和时间关联性的特征,因此可以用压缩感知的方法来对云服务资源信息进行恢复重建,比起传统方法使用随机抽样和统计估算的方法,会让云服务资源信息的恢复精度更高,并且利用了云资源信息数据中复杂的潜在关系。而比起当前恢复效果较好的深度学习模型,具有计算成本低和减少时间开销的特点;
2.本发明基于压缩感知的预测性在线调度算法CSPOS,是一种利用在线服务信息主动调度批处理作业的新方法,该方法能够有效缓解云数据中心的网络拥塞,改善数据中心的各种性能指标,基于cMAB的在线学习模型能够根据实时在线服务信息,自适应地调度新到达的批处理作业,由于数据中心环境具有高动态性,而此模型的激励机制完全基于当前的资源利用率,因此可以很适合在云数据中心进行高效部署,比传统的启发式算法如公平调度,首次拟合和装箱策略的调度效率有着明显的提升,并且比起当前基于深度强化学习的模型有着轻量级和易于部署的特点;
3.本发明显著提高了资源利用率,并且具有非常低的部署成本,运行的时间开销也非常小,对整体系统的影响可以忽略不计。
附图说明
图1是本发明公开的面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法流程图。
图2是在线服务资源信息的低秩特征图。
图3是在线服务资源信息的时间关联特征图。
图4是在不同任务完成时间(JCT<10,JCT<20,JCT<30)的批处理作业调度数量在不同调度方法下与本发明公开方法的对比图。
图5是在本发明公开方法CSPOS下CPU平均利用率提升效果图。
图6是在本发明公开方法CSPOS下批处理作业调度时间图。
具体实施方式
附图仅用于示例性说明,不能理解为对本发明的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。
一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,包括以下步骤:
步骤1.从云数据中心获取特定时间段内各服务器中在线服务器的资源信息;
步骤2.分析资源信息的数据特征,基于压缩感知的方法对资源信息进行抽样和压缩。
首先通过数据分析的方法来验证压缩感知对于云数据中心资源传输的可行性,这里使用的是阿里巴巴开发的集群数据集v2018,使用压缩感知方法需要有两个先决条件,一个是随机采样,另外一个是矩阵重构的低秩特征,而奇异值分解是一种确定矩阵是否低秩的有效方法。
利用奇异值分解的方法确定矩阵是否低秩;具体包括:假设一个奇异矩阵σi代表奇异矩阵对角线上的元素如果存在一个r,使得满足公式(1),那么则证明这个矩阵是低秩的:
r<<min(n,m) (1)
本发明在所有时间步长上选择了在线服务资源指标CPU利用率和内存,通过实验证明了在线服务需求的资源是符合低秩特征的,如图2所示,所以可以很好地利用压缩感知方法来恢复采样数据。
此外,在在线服务资源信息数据中发现的第二个特征是时间关联性,如图3所示,假设xi,j代表在t时间上第i台服务器的资源信息,以下公式(2)通过Δxi,j来表示时间关联性:
其中,(2)中分母代表的是两个连续时间步长之间资源需求的最大差异;对于CPU资源信息,90%的数据在两个连续时间步长之间的差异小于20%,所以可以利用时间关联性来协助恢复CPU资源信息的重建过程。
通过数据分析之后,可以利用基于压缩感知地方法来对资源信息进行压缩,这一步的主要目的是缓解网络拥塞并大幅降低从云服务器传输到调度器的成本,利用压缩感知的核心思想,通过在每个调度周期随机抽样一小部分云服务器(本发明中随机抽样的概率为30%),来恢复在线服务的资源使用信息。
基于压缩感知的方法对资源信息进行抽样和压缩具体包括以下步骤:
S21.对云数据中心的资源信息进行建模,定义代表在时间t上所有n个服务器的资源信息,/>则为一个二值指标,取1代表在该服务器上进行抽样,取0代表未在该服务器上进行采样,那么当前抽样得到的在线服务资源信息就可以表示为这两者的点积,用ht来表示ht=bt·xt;
S22.定义代表在T时间段内在线服务的总资源信息,/>表示恢复的结果,B为二值指标bt对应的矩阵,那么数据重构的问题就可以转化为以下目标函数的优化问题,如公式(3):
S23.进一步通过奇异值分解SVD方法将此优化目标进行求解,因此优化问题可以转化为以下表示形式:
S24.为了求解(4)中这个带约束的优化问题,采用拉格朗日乘子法对此问题进行求解:
在公式(5)中,拉格朗日参数λ是可以调节约束和秩最小化折衷的控制参数;
S25.通过前面的分析还可以得出CPU资源信息还跟时间有较强的关联性,所以在对CPU资源信息恢复的过程中从时间维度上进行求解,这里利用关于时间T的托普利兹矩阵最终的目标函数为:
其中,公式(6)中的为时间关系项;这是一个带有时间关系的矩阵重构优化问题,通过第一步我们得知这个是针对CPU资源信息重构的,而内存信息的重构则可以把托普利兹矩阵/>看成是一个零矩阵,优化求解过程大致相同。
步骤3.调度器获取压缩后的资源信息进行恢复,并将其作为LSTM模型的输入来预测下一时间段在线服务器的资源使用信息。
步骤2解决了基于压缩感知的信息重构问题,即解决了当前服务占用资源信息的获取和传输问题,但由于云数据中心有众多服务器,如果调度器需要在调度期间的每个时间步骤处理在线服务的需求资源信息,那么调度器的效率将会下降。因此,本发明的CSPOS方法使用预测模型来预测下一个时间段的在线服务的资源需求,在下一个阶段,调度器将不再需要接收和处理在线服务的需求信息。所以本发明利用长短期记忆模型LSTM来预测下一阶段的在线服务需求信息,但由于在线服务具有资源请求波动大的特点,因此使用LSTM来预测的资源需求与实际情况往往会产生偏差,比如可能在某个时间段上突然出现需求洪峰,这时候仅仅依赖预测结果来进行调度就是不可行的,资源需求洪峰在在线服务中是比较常见的,为了应对这种情况,本发明在预测后添加了一个预测需求值
在下一个周期{T1,…,Tf}中,假设预测结果为其中f是周期的长度,对于每台云服务器i∈{1,…,n},需要选择一个特殊的预测需求pi,k满足以下条件:
pi,k≥95%of max(pi,k),k∈{T1,…,Tf} (7)
当选择了一个合适的pi,k值后,将其扩展到当前时间段内资源的预测需求值假设/>为云数据中心资源信息的原始值,那么用于下一时间段内批处理作业调度的可用资源U就可以表示为:
步骤4.从云数据中心获取下一时间段内将要处理的批处理作业调度需求的资源信息。
步骤5.结合当前在线服务器可用资源信息和批处理作业调度所需的资源信息,构建基于cMAB的在线学习模型,来对批作业进行调度。
根据步骤3计算得到的可用资源U,利用基于cMAB的在线学习模型来进行批处理作业的调度了,cMAB是一种高效的在线学习机制,比深度强化学习方法更加轻量级,此外,cMAB可以利用动态可用的云资源的上下文信息来进行调度策略学习。由于数据中心有大量的服务器,如果调度器需要决定每个批处理作业需要放置在哪台服务器并计算其优先级,效率就会大幅降低。因此,CSPOS可以确定批处理作业与一定范围的资源量进行适配,基于这个想法,可以将可用资源信息划分为多个资源范围,因此可以按照百分比来划分空闲资源,对于所有类型资源可以划分为[2%,4%,6%,8%,16%,32%,64%,100%]。
构建基于cMAB的在线学习模型具体包括:给定可用CPU资源Uc和可用内存资源Um,在特定的时间t,当批处理作业ht到达时,并且它对CPU和内存的需求分别为Yc和Ym,那么n(Yc,Ym,Uc,Um)定义为满足批处理作业调度需求资源的次数,用Y来表示,μ(Y)则表示其期望值,那么最终的在线学习模型可以表示为:
I(Y)= μ(Y)+ R(Y) (9)
式中,代表的是在线学习模型的置信半径。从公式(9)中可以看出基于cMAB的在线学习模型同时拥有剥削exploitation和探索exploration的机制,当Y的期望值小的时候,R(Y)会显著增加,这就是探索的机制;当Y的期望值大时,就会占据I(Y)的一大部分,这就是剥削的机制。
最后,以实验来验证本发明所提方案的可行性,如图4所示,显示的是在不同方法下不同任务完成时间(10,20,50)的批处理作业完成的数量,可以看出本发明所提出的方案比起其他方法能有效提升调度的效率,并且提高批处理作业完成的数量。然后,以系统的CPU平均利用率为例进行测试,如图5所示,可以看出本发明公开方案比起基准线有着明显的提升,所以CSPOS的调度方法能有效提升资源的利用率,同时还对本发明提出方法CSPOS的调度时间进行实验,如图6所示,可以看出CSPOS模型的时间开销非常小,对云数据中心的整体系统性能的影响可以忽略不计。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (5)
1.一种面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,其特征在于,包括以下步骤:
S1.从云数据中心获取特定时间段内各服务器中在线服务器的资源信息;
S2.分析资源信息的数据特征,基于压缩感知的方法对资源信息进行抽样和压缩;
S3.调度器获取压缩后的资源信息进行恢复,并将其作为LSTM模型的输入来预测下一时间段在线服务器的资源使用信息;
S4.从云数据中心获取下一时间段内将要处理的批处理作业调度需求的资源信息;
S5.结合当前在线服务器可用资源信息和批处理作业调度所需的资源信息,构建基于cMAB的在线学习模型,来对批作业进行调度;
在步骤S2中,分析资源信息的数据特征包括是否具有矩阵重构的低秩特征和时间关联性,以此判断是否可以使用压缩感知的方法以及是否可以利用时间关联性来协助恢复CPU资源信息的重建过程;
其中,判断是否具有时间关联性的步骤包括:假设xi,j代表在t时间上第i台服务器的资源信息,以下公式(1)通过Δxi,j来表示时间关联性:
利用奇异值分解的方法确定矩阵是否低秩,具体步骤包括:假设一个奇异矩阵σi代表奇异矩阵对角线上的元素,如果存在一个r,使得满足公式(2),那么则证明这个矩阵是低秩的:
2.根据权利要求1所述的面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,其特征在于,所述的步骤S2中,基于压缩感知的方法对资源信息进行抽样和压缩具体包括以下步骤:
S21.对云数据中心的资源信息进行建模,定义代表在时间t上所有n个服务器的资源信息,/>则为一个二值指标,取1代表在该服务器上进行抽样,取0代表未在该服务器上进行采样,那么当前抽样得到的在线服务资源信息就可以表示为这两者的点积,用ht来表示ht=bt·xt;
S22.定义代表在T时间段内在线服务的总资源信息,/>表示恢复的结果,B为二值指标bt对应的矩阵,那么数据重构的问题就可以转化为以下目标函数的优化问题,如公式(3):
S23.进一步通过奇异值分解SVD方法将此优化目标进行求解,因此优化问题可以转化为以下表示形式:
s.t.B·(LRT)=H (4)
S24.为了求解(4)中这个带约束的优化问题,采用拉格朗日乘子法对此问题进行求解:
在公式(5)中,拉格朗日参数λ是可以调节约束和秩最小化折衷的控制参数;
S25.CPU资源信息跟时间有较强的关联性,所以在对CPU资源信息恢复的过程中从时间维度上进行求解,利用关于时间T的托普利兹矩阵最终的目标函数为:
其中,公式(6)中的为时间关系项。
3.根据权利要求2所述的面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,其特征在于,为了应对出现资源需求出现洪峰的情况,在通过长短期记忆模型LSTM预测下一阶段的在线服务需求信息后,再增加一个预测需求值
4.根据权利要求3所述的面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,其特征在于,在下一个周期{T1,…,Tf}中,假设预测结果为其中f是周期的长度,对于每台云服务器i∈{1,…,n},需要选择一个特殊的预测需求pi,k满足以下条件:
pi,k≥95%of max(pi,k),k∈{T1,…,Tf} (7)
当选择了一个合适的pi,k值后,将其扩展到当前时间段内资源的预测需求值假设/>为云数据中心资源信息的原始值,那么用于下一时间段内批处理作业调度的可用资源U就可以表示为:
5.根据权利要求4所述的面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法,其特征在于,所述的步骤S5中构建基于cMAB的在线学习模型具体包括:给定可用CPU资源Uc和可用内存资源Um,在特定的时间t,当批处理作业ht到达时,并且它对CPU和内存的需求分别为Yc和Ym,那么n(Yc,Ym,Uc,Um)定义为满足批处理作业调度需求资源的次数,用Y来表示,μ(Y)则表示其期望值,那么最终的在线学习模型可以表示为:
I(Y)=μ(Y)+R(Y) (9)
式中,代表的是在线学习模型的置信半径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011521067.1A CN112631750B (zh) | 2020-12-21 | 2020-12-21 | 面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011521067.1A CN112631750B (zh) | 2020-12-21 | 2020-12-21 | 面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112631750A CN112631750A (zh) | 2021-04-09 |
CN112631750B true CN112631750B (zh) | 2024-04-09 |
Family
ID=75320392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011521067.1A Active CN112631750B (zh) | 2020-12-21 | 2020-12-21 | 面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112631750B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113821323B (zh) * | 2021-09-16 | 2023-09-19 | 中山大学 | 一种面向混合部署数据中心场景的离线作业任务调度算法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317654A (zh) * | 2014-10-09 | 2015-01-28 | 南京大学镇江高新技术研究院 | 基于动态温度预测模型的数据中心任务调度方法 |
CN109754405A (zh) * | 2018-12-22 | 2019-05-14 | 嘉兴学院 | 一种基于图像边缘信息的压缩采样方法 |
CN111026550A (zh) * | 2019-11-29 | 2020-04-17 | 中国科学院深圳先进技术研究院 | 容器云环境下的任务调度方法、装置、服务器及存储装置 |
CN111726768A (zh) * | 2020-06-16 | 2020-09-29 | 天津理工大学 | 一种基于压缩感知面向边缘计算的可靠数据收集方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10073701B2 (en) * | 2013-07-29 | 2018-09-11 | The Regents Of The University Of California | Scalable and parameterized VLSI architecture for compressive sensing sparse approximation |
-
2020
- 2020-12-21 CN CN202011521067.1A patent/CN112631750B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317654A (zh) * | 2014-10-09 | 2015-01-28 | 南京大学镇江高新技术研究院 | 基于动态温度预测模型的数据中心任务调度方法 |
CN109754405A (zh) * | 2018-12-22 | 2019-05-14 | 嘉兴学院 | 一种基于图像边缘信息的压缩采样方法 |
CN111026550A (zh) * | 2019-11-29 | 2020-04-17 | 中国科学院深圳先进技术研究院 | 容器云环境下的任务调度方法、装置、服务器及存储装置 |
CN111726768A (zh) * | 2020-06-16 | 2020-09-29 | 天津理工大学 | 一种基于压缩感知面向边缘计算的可靠数据收集方法 |
Non-Patent Citations (2)
Title |
---|
数据无线传感器网络中的损耗与重构;孔令和等;《IEEE并行与分布式系统汇刊》;第第25卷卷(第第11期期);第2818-2828页 * |
面向代价高效的分层联邦边缘学习的联合边缘关联和资源分配;陈旭等;无线通信交易;第第19卷卷(第第10期期);第6535-6548页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112631750A (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113242568B (zh) | 一种不确定网络环境中的任务卸载和资源分配方法 | |
CN106933649B (zh) | 基于移动平均和神经网络的虚拟机负载预测方法及系统 | |
CN110532154B (zh) | 应用系统扩容方法、装置和设备 | |
CN111435463A (zh) | 数据处理方法及相关设备、系统 | |
CN107392259B (zh) | 构建不均衡样本分类模型的方法和装置 | |
CN112631750B (zh) | 面向云数据中心的基于压缩感知的预测性在线调度与混合任务部署方法 | |
CN113657634A (zh) | 银行网点排队等待时长预测方法及装置 | |
CN115118602A (zh) | 一种基于使用量预测的容器资源动态调度方法及系统 | |
CN113537850A (zh) | 仓储优化方法、装置、计算机设备和存储介质 | |
CN116541176A (zh) | 算力资源分配的优化方法、优化装置、电子设备和介质 | |
CN113051130A (zh) | 结合注意力机制的lstm网络的移动云负载预测方法及系统 | |
CN114625477A (zh) | 一种服务节点容量调整方法、设备及计算机可读存储介质 | |
CN114065864A (zh) | 联邦学习方法、联邦学习装置、电子设备以及存储介质 | |
Jeon et al. | Intelligent resource scaling for container based digital twin simulation of consumer electronics | |
Kushwaha et al. | Optimal device selection in federated learning for resource-constrained edge networks | |
CN113821419A (zh) | 一种基于svr和高斯函数的云服务器老化预测方法 | |
CN112667394B (zh) | 一种计算机资源利用率优化方法 | |
CN103873388A (zh) | 一种网络内容控制方法和网络设备 | |
CN109905289B (zh) | 一种网络服务可信属性动态预测方法 | |
CN114298397A (zh) | 一种运用时序数据的深度强化学习建筑能耗预测方法 | |
CN114217933A (zh) | 多任务调度方法、装置、设备以及存储介质 | |
CN114037060A (zh) | 预训练模型的生成方法、装置、电子设备以及存储介质 | |
CN111026626A (zh) | Cpu消耗量预估、预估模型训练方法及装置 | |
CN113313313B (zh) | 一种面向城市感知的移动节点任务规划方法 | |
CN112906723A (zh) | 一种特征选择的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |