CN113296947A - 基于改进XGBoost模型的资源需求预测方法 - Google Patents

基于改进XGBoost模型的资源需求预测方法 Download PDF

Info

Publication number
CN113296947A
CN113296947A CN202110563630.XA CN202110563630A CN113296947A CN 113296947 A CN113296947 A CN 113296947A CN 202110563630 A CN202110563630 A CN 202110563630A CN 113296947 A CN113296947 A CN 113296947A
Authority
CN
China
Prior art keywords
time sequence
xgboost model
resource demand
data
regression tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110563630.XA
Other languages
English (en)
Other versions
CN113296947B (zh
Inventor
肖楚铭
吴维刚
尹烨
常红立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Sun Yat Sen University
Original Assignee
Tencent Technology Shenzhen Co Ltd
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Sun Yat Sen University filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110563630.XA priority Critical patent/CN113296947B/zh
Publication of CN113296947A publication Critical patent/CN113296947A/zh
Application granted granted Critical
Publication of CN113296947B publication Critical patent/CN113296947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明为克服采用XGBoost模型进行资源需求预测时存在输出限定在一定范围内,导致无法准确预测时序模式的缺陷,提出一种基于改进XGBoost模型的资源需求预测方法,包括以下步骤:采集集群中所有容器的时间段T内的多维度时序数据;将多维度时序数据输入XGBoost模型中,得到每棵回归树的输出W;将多维度时序数据输入第一卷积神经网络中学习时序的模式,确定每棵回归树的权重H;将多维度时序数据输入第二卷积神经网络中提取时序中的数据特征,并根据时序的数据特征所述得到偏移值B;根据XGBoost模型中每棵回归树的输出W及其对应的权重H进行加权相加,进一步结合偏移值B得到下一时刻的资源需求预测结果。

Description

基于改进XGBoost模型的资源需求预测方法
技术领域
本发明涉及集群资源管理技术领域,更具体地,涉及一种基于改进XGBoost模型的资源需求预测方法。
背景技术
为了提高集群的资源利用率,目前主要采用混合部署的方法,即将在线服务和离线任务部署到同一集群中,当在线服务资源使用量较低时,调度上离线任务,减少资源闲置,从而提高总体资源利用率。
目前主要通过预测在线服务未来的资源使用量进行合理调度离线任务,常见的时序预测模型主要有三类:第一类,基于统计学的模型,如ARIMA(整合移动平均自回归模型);第二类,机器学习模型,如XGBoost(极度梯度提升树);第三类,深度学习模型,如LSTM(长短期记忆网络)等。这些模型都可以直接用于集群内的资源需求预测,但从实际应用方面来看,这些方法都有各自的缺点。比如XGBoost的输出有一定限制范围,只能处理训练集中已有的情况,对超出训练集范围的数据(比如呈增长趋势的时序)预测效果会大打折扣。对于深度学习的方法,如果是简单结构的神经网络,则存在预测精度较低的问题;如果是复杂结构的神经网络,虽然能够提升预测效果,但泛化能力较弱,需要针对不同数据分别调参,对数据的完整性等方面的要求也会更高,不利于实际部署。
在现有的研究中,人们会将不同模型进行结合,实现不同模型的优势互补,比如将神经网络与XGBoost模型进行结合,如公开号为CN112541127A(公开日2021-03-23)提出的一种基于资源配额使用率的分场景信息推送方法。但现有的神经网络与XGBoost模型结合方法本质上是将两个模型堆叠起来,并不能改善这两种模型的缺点。这些方法主要有两种做法:第一,使用神经网络做特征提取,然后将提取到的特征输入到XGBoost中;第二,使用XGBoost做特征提取,然后将提取到的特征输入到神经网络。这些方法中XGBoost的输出仍然存在范围限制,所以整体模型的输出也只能在一定范围内,如果输入的数据范围超出了训练集的范围,那么模型只能输出训练集的上界或下界,无法准确预测时序模式。
发明内容
本发明为克服上述现有技术中采用XGBoost模型进行资源需求预测时存在输出限定在一定范围内,导致无法准确预测时序模式的缺陷,提供一种基于改进XGBoost模型的资源需求预测方法。
为解决上述技术问题,本发明的技术方案如下:
基于改进XGBoost模型的资源需求预测方法,包括以下步骤:
采集集群中所有容器的时间段T内的多维度时序数据;
将多维度时序数据输入XGBoost模型中,得到每棵回归树的输出W;
将多维度时序数据输入第一卷积神经网络中学习时序的模式,确定每棵回归树的权重H;
将多维度时序数据输入第二卷积神经网络中提取时序中的数据特征,并根据时序的数据特征所述得到偏移值B;
根据XGBoost模型中每棵回归树的输出W及其对应的权重H进行加权相加,进一步结合偏移值B得到下一时刻的资源需求预测结果。
作为优选方案,多维度时序数据包括内存、CPU、网络I/O、时间中的一种或多种。
作为优选方案,采集集群中所有容器的时间段T内的多维度时序数据的步骤包括:设置一个大小为T的时间窗口,集群中所有容器采用所述时间窗口获取多维度时序。
作为优选方案,所述XGBoost模型包括多棵回归树,每棵回归树通过加性方式进行组合。
作为优选方案,本发明方法还包括以下步骤:将采集的n个多维度时序数据样本及其对应的k个特征组成训练数据集D,将所述训练数集输入XGBoost模型中进行训练;计算XGBoost模型的目标函数L并使其最小化;其中训练数据集
Figure BDA0003079912570000021
xi为第i时刻多维度时序的取值,
Figure BDA0003079912570000022
中的上标k表示多维度时序的维度数;yi为目标时序在时刻i的取值;所述XGBoost模型的目标函数L的表达公式如下:
Figure BDA0003079912570000023
Figure BDA0003079912570000031
式中,
Figure BDA0003079912570000032
表示损失函数,
Figure BDA0003079912570000033
为目标时序在时刻i的预测值;Ω(fk)表示正则项,fk表示XGBoost中的第k棵树;μ为学习率,T为回归树中叶子的数量,λ为正则参数,ω为叶子权重。
作为优选方案,所述损失函数采用均方损失函数,其表达公式为:
Figure BDA0003079912570000034
作为优选方案,本发明方法还包括以下步骤:在所述XGBoost模型的训练过程中,在每次迭代时构建一棵新的回归树加入到所述XGBoost模型中,使构建的回归树能够最小化XGBoost模型的目标函数;在第t次迭代中,令ft(xi)为第i个样本在第t次迭代中生成的回归树,则目标函数为:
Figure BDA0003079912570000035
式中,
Figure BDA0003079912570000036
为第t次迭代时目标时序在时刻i的预测值。
作为优选方案,在构建新的回归树时,遍历所述训练数据集中的所有特征,选择每个特征值作为其分割点并计算其分裂增益,当遍历所有特征后,将分裂增益值最大的特征值作为分割点建立新的回归树;所述分裂增益的计算公式如下:
Figure BDA0003079912570000037
Figure BDA0003079912570000038
Figure BDA0003079912570000039
Figure BDA00030799125700000310
式中,Ij为每个叶子节点j上的样本集合,q(xi)表示第i个样本所落在的叶子节点;gi表示损失函数的一阶微分;hi表示损失函数的二阶微分;GL、GR表示分裂点左边/右边的G,HL、HR表示分裂点左边/右边的H;λ和γ为可调整的超参数。
作为优选方案,所述第一卷积神经网络采用Weight CNN卷积神经网络,所述第一卷积神经网络中包括若干卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为大于1小于窗口高度的值;将所述卷积核置于时序的开头,沿时间增长方向移动并逐一进行卷积,然后将所述卷积核的输出分别输入全连接层中,输出对应的每棵回归树的权重。
作为优选方案,所述第二卷积神经网络采用Offset CNN卷积神经网络,所述第二卷积神经网络包括一个或多个卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为1;将所述卷积核置于时序的开头,沿时间增长方向移动卷积核,提取得到每个时间点的数据特征,然后将卷积核输出的数据特征分别输入全连接层中,输出得到偏移值B。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过卷积神经网络学习时序数据中的隐含模式,进而动态调整XGBoost模型中每棵回归树的权重,并且使用卷积神经网络对输入的时序数据提取相应的特征,进而得到偏移值用于对加权相加后的结果做进一步的调整,能够对训练集范围外的数据保持较高的预测准确率;
本发明提升了对大规模集群数据集预测的泛化能力,改善了传统XGBoost模型的缺陷,使模型的输出不再受到训练集数据量级的制约,能够在相同时序模式情况下,做到模型输出随输入数据量级的改变而改变。
附图说明
图1为本发明的基于改进XGBoost模型的资源需求预测方法的流程图。
图2为本发明的基于改进XGBoost模型的资源需求预测方法的流程示意图。
图3为实施例2中传统XGBoost模型的时序模式预测结果对比图。
图4为实施例2中改进XGBoost模型的时序模式预测结果对比图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本实施例提出一种基于改进XGBoost模型的资源需求预测方法,如图1~2所示,为本实施例的流程图。
本实施例提出的基于改进XGBoost模型的资源需求预测方法中包括以下步骤:
S1:采集集群中所有容器的时间段T内的多维度时序数据。
本实施例中,采集的多维度时序数据包括内存、CPU、网络I/O、时间中的一种或多种,用于作为XGBoost模型的输入预测一个维度上的时序值。
进一步的,设置一个大小为T的时间窗口,采用所述时间窗口对集群中每个容器进行多维度时序的采集。
S2:将多维度时序数据输入XGBoost模型中,得到每棵回归树的输出W。
本步骤中,还包括以下步骤:采集的n个多维度时序数据样本及其对应的k个特征并组成训练数据集D,将所述训练数集输入XGBoost模型中进行训练;计算XGBoost模型的目标函数L并使其最小化;其中训练数据集
Figure BDA0003079912570000051
xi为第i时刻多维度时序的取值,yi为目标时序在时刻i的取值;
Figure BDA0003079912570000052
中的上标k表示多维度时序的维度数;
所述XGBoost模型的目标函数L的表达公式如下:
Figure BDA0003079912570000053
Figure BDA0003079912570000054
Figure BDA0003079912570000055
式中,
Figure BDA0003079912570000056
表示损失函数,本实施例中采用均方损失函数,该损失函数用于度量预测值
Figure BDA0003079912570000057
和真实值yi之间的差异;
Figure BDA0003079912570000058
为目标时序在时刻i的预测值,yi为目标时序在时刻i的真实值;Ω(fk)表示正则项,代表模型的复杂度,fk表示XGBoost中的第k棵树;μ为学习率,T为回归树中叶子的数量,λ为正则参数,ω为叶子权重。本实施例中的目标函数L在损失函数的基础上加上正则项Ω(fk)能够控制模型的复杂度,避免过拟合。
进一步的,本实施例中XGBoost模型中包括多棵回归树,每棵回归树通过加性方式进行组合,具体的,在所述XGBoost模型的训练过程中,在每次迭代时构建一棵新的回归树加入到所述XGBoost模型中,使构建的回归树能够最小化目标函数L;在第t次迭代中,令ft(xi)为第i个样本在第t次迭代中生成的回归树,则目标函数表示为:
Figure BDA0003079912570000061
式中,
Figure BDA0003079912570000062
为第t次迭代时目标时序在时刻i的预测值。
在构建新的回归树时,遍历所述训练数据集中的所有特征,选择每个特征值作为其分割点并计算其分裂增益,当遍历所有特征后,将分裂增益值最大的特征值作为分割点建立新的回归树;所述分裂增益的计算公式如下:
Figure BDA0003079912570000063
Figure BDA0003079912570000064
Figure BDA0003079912570000065
Ij={i|q(xi)=j}
式中,Ij为每个叶子节点j上的样本集合,q(xi)表示第i个样本所落在的叶子节点;gi表示损失函数的一阶微分;hi表示损失函数的二阶微分;GL、GR表示分裂点左边/右边的G,HL、HR表示分裂点左边/右边的H;λ和γ为可调整的超参数。
S3:将多维度时序数据输入第一卷积神经网络中学习时序的模式,确定每棵回归树的权重H。
本实施例中的第一卷积神经网络采用Weight CNN卷积神经网络,所述第一卷积神经网络中包括若干卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为大于1小于窗口高度的值;将所述卷积核置于时序的开头,沿时间增长方向移动并逐一进行卷积,然后将所述卷积核的输出分别输入全连接层中,输出对应的每棵回归树的权重H。
S4:将多维度时序数据输入第二卷积神经网络中提取时序中的数据特征,并根据时序的数据特征所述得到偏移值B。
本实施例中的第二卷积神经网络采用Offset CNN卷积神经网络,所述第二卷积神经网络包括一个或多个卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为1;将所述卷积核置于时序的开头,沿时间增长方向移动卷积核,提取得到每个时间点的数据特征,然后将卷积核输出的数据特征分别输入全连接层中,输出得到偏移值B。
S5:根据XGBoost模型中每棵回归树的输出W及其对应的权重H进行加权相加,进一步结合偏移值B得到下一时刻的资源需求预测结果。
在具体实施过程中,将每个容器中时间窗口内的多维度时序作为输入,预测目标时序下一个时间点的时序值,即T+1时间点的时序值,上述过程的表达公式如下:
Figure BDA0003079912570000071
式中,F(X)表示本实施例的改进XGBoost模型,且X为一个时间窗口内多维度时序x的取值,即
Figure BDA0003079912570000072
其中
Figure BDA0003079912570000073
表示第t时刻d个维度的时序的取值。
本实施例中的改进XGBoost模型中包括XGBoost模型、采用Weight CNN的第一卷积神经网络、采用Offset CNN的第二卷积神经网络。其中,本实施例中的XGBoost模型用于处理多维度时序数据,得到每棵回归树的输出W,采用Weight CNN的第一卷积神经网络用于学习时序中的模式,确定每棵回归树的权重H;采用Offset CNN的第二卷积神经网络用于提取时序中的特征,得到偏移值B;改进XGBoost模型将上述三个输出进行结合得到预测值
Figure BDA0003079912570000074
并进行输出,其表达公式如下:
Figure BDA0003079912570000075
本实施例通过卷积神经网络学习时序数据中的隐含模式,进而动态调整XGBoost模型中每棵回归树的权重,并且使用卷积神经网络对输入的时序数据提取相应的特征,进而得到偏移值用于对加权相加后的结果做进一步的调整,得到准确率更高的时序预测结果。
实施例2
本实施例应用实施例1提出的基于改进XGBoost模型的资源需求预测方法,提出一种具体实施方式。
本实例采用腾讯IEG内部的集群数据集,共有1074个容器,每个容器有CPU、内存、网络输入、网络输出以及时间共5个维度的时序数据,时间跨度为14天,时间间隔为30秒。
本实施例对每个容器进行单独的训练和测试,将12天数据作为训练集,1天数据作为验证集,1天数据作为测试集。
设置本实施例的改进XGBoost模型(Enhanced-XGB)的超参数,其中,时间窗口大小设置为T=10,XGBoost的回归树个数为M=300,Weight CNN的卷积核参数为5x3,OffsetCNN的卷积核参数为5x1,并使用平均绝对值误差(MAE)作为目标函数,使用随机梯度下降算法来优化模型,学习率为μ=6e-5。
将每个容器的时序数据标准化之后再进行训练,测试时,对标准化之后的数据使用MSE(平均平方值误差)、MAE(平均绝对值误差)作为衡量指标,而对逆标准化之后的数据使用MAPE(平均绝对值百分比误差)作为衡量指标。其中,MAPE的公式如下:
Figure BDA0003079912570000081
式中,n为样本个数。
将数据集输入改进XGBoost模型(Enhanced-XGB)和传统XGBoost模型中进行对比,其试验结果如表1所示。
表1改进XGBoost模型和传统XGBoost模型的试验结果
模型 MSE MAE MAPE(%)
XGBoost 0.266 0.307 18.78
Enhanced-XGB 0.248 0.250 13.61
其中,表1为所有容器对应指标的平均结果,由表1可知,本发明提出的改进XGBoost模型在各项指标上的表现均优于传统XGBoost模型。
为了检验本发明的改进XGBoost模型的泛化性能,本实施例对所有容器的MAPE结果进行统计分析,如下表2所示。
表2改进XGBoost模型和传统XGBoost模型的MAPE结果
模型 平均值(%) 最大值(%) 最小值(%) 方差
XGBoost 18.78 3118.63 0.14 9089
Enhanced-XGB 13.61 255.10 0.09 123
由表2可知,本发明提出的改进XGBoost模型在方差和最大值上明显优于传统的XGBoost模型,表明本发明提出的改进XGBoost模型对于整个数据集的泛化性能更好,整体的预测效果得到提升,不同容器之间的预测效果相差不会特别大,整体比较平稳。而传统的XGBoost模型,整体预测效果的起伏很大,在一部分容器上的预测效果特别差,在另一部分容器上的预测效果又比较好,对于实际应用的角度来说比较不利。
为了验证本发明对于超出训练集范围数据的预测效果,本实施例还做了以下实验,对于呈增长趋势的时序,XGBoost和Enhanced-XGB的实验结果如图3~4所示。由图可知,训练集和测试集的时序模式是相同的,只是数据的量级不同,但传统的XGBoost对于这种情况的预测效果不理想,完全没法反映出时序模式,而本发明的模型仍可以对超出训练集范围外的数据进行有效的预测,对测试集的时序模式能够做出较为准确的预测。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.基于改进XGBoost模型的资源需求预测方法,其特征在于,包括以下步骤:
采集集群中所有容器的时间段T内的多维度时序数据;
将多维度时序数据输入XGBoost模型中,得到每棵回归树的输出W;
将多维度时序数据输入第一卷积神经网络中学习时序的模式,确定每棵回归树的权重H;
将多维度时序数据输入第二卷积神经网络中提取时序中的数据特征,并根据时序的数据特征所述得到偏移值B;
根据XGBoost模型中每棵回归树的输出W及其对应的权重H进行加权相加,进一步结合偏移值B得到下一时刻的资源需求预测结果。
2.根据权利要求1所述的资源需求预测方法,其特征在于,所述多维度时序数据包括内存、CPU、网络I/O、时间中的一种或多种。
3.根据权利要求1所述的资源需求预测方法,其特征在于,采集集群中所有容器的时间段T内的多维度时序数据的步骤包括:设置一个大小为T的时间窗口,集群中所有容器采用所述时间窗口获取多维度时序。
4.根据权利要求1所述的资源需求预测方法,其特征在于,所述XGBoost模型包括多棵回归树,每棵回归树通过加性方式进行组合。
5.根据权利要求4所述的资源需求预测方法,其特征在于,还包括以下步骤:将采集的n个多维度时序数据样本及其对应的k个特征组成训练数据集D,将所述训练数集输入XGBoost模型中进行训练;计算XGBoost模型的目标函数L并使其最小化;
其中训练数据集D={(xi,yi)}
Figure FDA0003079912560000011
xi为第i时刻多维度时序的取值,
Figure FDA0003079912560000012
中的上标k表示多维度时序的维度数;yi为目标时序在时刻i的取值;
所述XGBoost模型的目标函数L的表达公式如下:
Figure FDA0003079912560000013
Figure FDA0003079912560000021
式中,
Figure FDA0003079912560000022
表示损失函数,
Figure FDA0003079912560000023
为目标时序在时刻i的预测值;Ω(fk)表示正则项,fk表示XGBoost中的第k棵树;μ为学习率,T为回归树中叶子的数量,λ为正则参数,ω为叶子权重。
6.根据权利要求5所述的资源需求预测方法,其特征在于,所述损失函数采用均方损失函数,其表达公式为:
Figure FDA0003079912560000024
7.根据权利要求6所述的资源需求预测方法,其特征在于,还包括以下步骤:在所述XGBoost模型的训练过程中,在每次迭代时构建一棵新的回归树加入到所述XGBoost模型中,使构建的回归树能够最小化XGBoost模型的目标函数;
在第t次迭代中,令ft(xi)为第i个样本在第t次迭代中生成的回归树,则目标函数为:
Figure FDA0003079912560000025
式中,
Figure FDA0003079912560000026
为第t次迭代时目标时序在时刻i的预测值。
8.根据权利要求7所述的资源需求预测方法,其特征在于,在构建新的回归树时,遍历所述训练数据集中的所有特征,选择每个特征值作为其分割点并计算其分裂增益gain,当遍历所有特征后,将分裂增益值gain最大的特征值作为分割点建立新的回归树;所述分裂增益gain的计算公式如下:
Figure FDA0003079912560000027
Figure FDA0003079912560000028
Figure FDA0003079912560000029
Ij={i|q(xi)=j}
式中,Ij为每个叶子节点j上的样本集合,q(xi)表示第i个样本所落在的叶子节点;gi表示损失函数的一阶微分;hi表示损失函数的二阶微分;GL、GR表示分裂点左边/右边的G,HL、HR表示分裂点左边/右边的H;λ和γ为可调整的超参数。
9.根据权利要求1所述的资源需求预测方法,其特征在于,所述第一卷积神经网络采用Weight CNN卷积神经网络,所述第一卷积神经网络中包括若干卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为大于1小于窗口高度的值;将所述卷积核置于时序的开头,沿时间增长方向移动并逐一进行卷积,然后将所述卷积核的输出分别输入全连接层中,输出对应的每棵回归树的权重。
10.根据权利要求1所述的资源需求预测方法,其特征在于,所述第二卷积神经网络采用Offset CNN卷积神经网络,所述第二卷积神经网络包括一个或多个卷积核和全连接层;所述卷积核的高为输入的多维度时序数据的维度,所述卷积核的宽为1;将所述卷积核置于时序的开头,沿时间增长方向移动卷积核,提取得到每个时间点的数据特征,然后将卷积核输出的数据特征分别输入全连接层中,输出得到偏移值B。
CN202110563630.XA 2021-05-24 2021-05-24 基于改进XGBoost模型的资源需求预测方法 Active CN113296947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110563630.XA CN113296947B (zh) 2021-05-24 2021-05-24 基于改进XGBoost模型的资源需求预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110563630.XA CN113296947B (zh) 2021-05-24 2021-05-24 基于改进XGBoost模型的资源需求预测方法

Publications (2)

Publication Number Publication Date
CN113296947A true CN113296947A (zh) 2021-08-24
CN113296947B CN113296947B (zh) 2023-05-23

Family

ID=77324177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110563630.XA Active CN113296947B (zh) 2021-05-24 2021-05-24 基于改进XGBoost模型的资源需求预测方法

Country Status (1)

Country Link
CN (1) CN113296947B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116610534A (zh) * 2023-07-18 2023-08-18 贵州海誉科技股份有限公司 一种基于Kubernetes集群资源的改进预测性弹性伸缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250931A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于随机卷积神经网络的高分辨率图像场景分类方法
CN110232400A (zh) * 2019-04-30 2019-09-13 冶金自动化研究设计院 一种梯度提升决策神经网络分类预测方法
US20190303758A1 (en) * 2018-03-16 2019-10-03 MCB Software Services Limited Resource allocation using a learned model
CN112564098A (zh) * 2020-12-02 2021-03-26 国网浙江省电力有限公司电力科学研究院 基于时间卷积神经网络的高比例光伏配电网电压预测方法
WO2021082809A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的训练优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250931A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于随机卷积神经网络的高分辨率图像场景分类方法
US20190303758A1 (en) * 2018-03-16 2019-10-03 MCB Software Services Limited Resource allocation using a learned model
CN110232400A (zh) * 2019-04-30 2019-09-13 冶金自动化研究设计院 一种梯度提升决策神经网络分类预测方法
WO2021082809A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的训练优化方法
CN112564098A (zh) * 2020-12-02 2021-03-26 国网浙江省电力有限公司电力科学研究院 基于时间卷积神经网络的高比例光伏配电网电压预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
RACHNA JAIN等: "Predicting Employee Attrition using XGBoost Machine Learning Approach", 《2018 INTERNATIONAL CONFERENCE ON SYSTEM MODELING & ADVANCEMENT IN RESEARCH TRENDS》 *
何龙著: "《深入理解XGBoost 高效机器学习算法与进阶》", 31 January 2020 *
刘志伟等: "基于卷积特征提取的XGBoost营收预测模型", 《网络安全技术与应用》 *
言有三: "《深度学习之人脸图像处理 核心算法与案例实战》", 31 July 2020, 机械工业出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116610534A (zh) * 2023-07-18 2023-08-18 贵州海誉科技股份有限公司 一种基于Kubernetes集群资源的改进预测性弹性伸缩方法
CN116610534B (zh) * 2023-07-18 2023-10-03 贵州海誉科技股份有限公司 一种基于Kubernetes集群资源的改进预测性弹性伸缩方法

Also Published As

Publication number Publication date
CN113296947B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN110728224B (zh) 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN106485262B (zh) 一种母线负荷预测方法
CN112232413B (zh) 基于图神经网络与谱聚类的高维数据特征选择方法
CN107766929B (zh) 模型分析方法及装置
CN109086799A (zh) 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN111899882B (zh) 一种预测癌症的方法及系统
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN107609588B (zh) 一种基于语音信号的帕金森患者updrs得分预测方法
CN110706823A (zh) 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法
CN110097060A (zh) 一种面向树干图像的开集识别方法
CN111027629A (zh) 基于改进随机森林的配电网故障停电率预测方法及系统
CN110163262A (zh) 模型训练方法、业务处理方法、装置、终端及存储介质
CN113298230A (zh) 一种基于生成对抗网络的不平衡数据集的预测方法
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN104850868A (zh) 一种基于k-means和神经网络聚类的客户细分方法
CN114091349A (zh) 一种基于多源领域自适应的滚动轴承寿命预测方法
Adeyemo et al. Effects of normalization techniques on logistic regression in data science
CN113296947A (zh) 基于改进XGBoost模型的资源需求预测方法
CN112926645B (zh) 一种基于边缘计算的窃电检测方法
Yang et al. A structure optimization algorithm of neural networks for large-scale data sets
CN104468276B (zh) 基于随机抽样多分类器的网络流量识别方法
CN111028086A (zh) 基于聚类与lstm网络的增强指数跟踪方法
CN115907775A (zh) 基于深度学习的个人征信评级方法及其应用
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN113610350B (zh) 复杂工况故障诊断方法、设备、存储介质及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant