CN114489944B

CN114489944B - 基于Kubernetes的预测式弹性伸缩方法

Info

Publication number: CN114489944B
Application number: CN202210080539.7A
Authority: CN
Inventors: 郭雯; 郑霁
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2022-12-20
Anticipated expiration: 2042-01-24
Also published as: CN114489944A

Abstract

本发明公开了基于Kubernetes的预测式弹性伸缩方法，涉及计算机应用技术领域，解决了现有技术提供的方法占用资源较多，且无法有效改善响应延迟的技术问题；本发明结合预测负载和当前负载对容器进行调整，实现弹性伸缩的目的；本发明通过建立或者更新的负载预测模型获取预测负载，根据预测负载和当前负载的对比结果更新当前负载，最后结合当前负载、系统使用率、Kubernetes自带模型获取目标副本数，实现容器的调整；本发明所占用的资源较少，且能够改善响应延迟；本发明在训练获取负载预测模型时，根据历史负载序列的数据量选择调用空闲节点或者公有云平台，通过空闲节点或者公有云平台的介入，提高数据处理效率。

Description

基于Kubernetes的预测式弹性伸缩方法

技术领域

本发明属于计算机应用领域，涉及基于Kubernetes的预测式弹性伸缩技术，具体是基于Kubernetes的预测式弹性伸缩方法。

背景技术

在容器云环境中，Kubernetes从不同的维度提供了多种组件，来满足不同的弹性伸缩需求；Kubernetes针对最小管理单元Pod，提供了垂直伸缩VPA(Vertical PodAutoscaler)和水平伸缩HPA(Horizontal Pod Autoscaler)两种方式；水平伸缩HPA是目前使用最广泛的弹性伸缩组件，也是本申请的基础。

Kubernetes中的弹性伸缩采用的是响应式策略，存在明显的滞后性，在一段时间内无法保证服务质量，对业务系统的使用造成负面影响；现有技术中，西南石油大学的陈雁等在Kubernetes中引入弹性伸缩容忍度的概念，提出步长容忍度算法，提高系统的可靠性与灵活性；广西大学的闫承鑫等利用灰色预测算法，研究了面向突变负载的容器云服务弹性供给服务策略；西安邮电大学的杨茂等采用指数平滑法进行负载预测，改善响应延迟；现有技术所用方法占用资源较多，且响应延迟改善不明显；因此，亟需一种基于Kubernetes的预测式弹性伸缩方法。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一；为此，本发明提出了基于Kubernetes的预测式弹性伸缩方法，用于解决现有技术提供的方法占用资源较多，且无法有效改善响应延迟的技术问题，本发明中引入了负载预测模型，通过负载预测模型预测负载，结合预测负载和当前负载对容器进行调整，实现弹性伸缩的目的。

为实现上述目的，根据本发明的第一方面的实施例提出基于Kubernetes的预测式弹性伸缩方法，包括：

历史负载序列结合公有云平台或者空闲节点建立或者更新负载预测模型；其中，负载预测模型基于时间序列模型或者人工智能模型建立，历史负载序列为包括负载数据以及对应时间的时间序列；

基于负载预测模型获取预测负载，并结合预测负载对当前负载重新定义，同时计算系统使用率；

当前负载、系统使用率结合Kubernetes自带模型获取目标副本数，根据目标副本数对容器进行调整，同时将当前负载更新至历史负载序列中；

通过更新后的历史负载序列对负载预测模型进行更新。

优选的，根据所述历史负载序列选择空闲节点或者公有云平台，包括：

获取历史负载序列的数据总量，并标记为LSZ；

获取空闲节点的数据处理量，并标记为KSC；

根据公式JPX＝LSZ/(m×KSC)+1获取节点评估系数JPX；其中，m为空闲节点数量；

当节点评估系数JPX≥2时，则通过空闲节点更新或者训练负载预测模型；否则，调用公有云平台更新或者训练负载预测模型。

优选的，根据基于所述人工智能模型建立的负载预测模型获取预测负载，包括：

以当前时刻为基准，获取时序参数序列；其中，时序参数序列包括若干个时刻对应的内存使用率、CPU使用率和容器副本数；

将时序参数序列输入至负载预测模型中获取下一时刻的预测负载。

优选的，基于所述人工智能模型建立负载预测模型，包括：

获取历史负载序列；其中，历史负载序列包括时序参数序列以及对应的负载值；

将历史负载序列中时序参数序列与下一时刻的负载值整合标准数据；

通过N条标准数据对人工智能模型进行训练，将训练完成的人工智能模型标记为负载预测模型；其中，人工智能模型包括RBF神经网络或者深度卷积神经网络，N为大于等于50的整数。

优选的，所述负载预测模型基于自回归移动平均模型建立，且自回归移动平均模型是自回归模型和移动平均模型的组合；

自回归移动平均模型定义为：

表示为ARMA(p，q)；其中，p为自回归阶数，q为移动平均阶数。

优选的，所述自回归模型定义为：

其中，u_t为随机干扰序列，即白噪声，且E(u_t)＝0时，表示随机波动相互抵消，

为自回归系数，p为自回归阶数。

优选的，所述移动平均模型定义为：

其中，

为移动回归系数，q为移动平均阶数。

优选的，当所述历史负载序列不稳定时，则引入差分次数将自回归移动平均模型变换为差分自回归移动平均模型，表示为ARMA(p，d，q)；其中，d为时间序列平稳时所做的差分次数。

优选的，所述差分自回归移动平均模型的建立包括：

步骤11：获取历史负载序列；

步骤12：对历史负载序列进行预处理，当历史负载序列是非稳定序列时，则通过d阶差分运算转换为平稳序列；

步骤13：确定p和q；其中，p和q的确定方法包括ACF或者PACF；

步骤14：通过参数估计方法进行参数拟合；其中，参数估计方法包括最小二乘法和最大似然法；

步骤15：将p、q和拟合获取的参数带入差分自回归移动平均模型公式中计算预测值，并与真实值对比核验。

优选的，结合所述预测负载对当前负载重新定义，包括：

基于负载预测模型获取预测负载；

读取系统中预测负载对应时刻的当前负载；

将预测负载大于当前负载，则将预测负载赋值给当前负载；当预测负载小于等于当前负载时，当前负载不变。

优选的，所述系统使用率的计算公式为：usageRatio＝utilization/targetUtilization；其中，usageRatio为系统使用率，utilization为当前需要使用的资源数值；targetUtilization为目标使用的资源数值。

优选的，通过所述当前负载对历史负载序列进行更新，并通过更新后的历史负载序列完成负载预测模型的更新，再通过负载预测模型进行新一阶段计算。

与现有技术相比，本发明的有益效果是：

1、本发明通过建立或者更新的负载预测模型获取预测负载，根据预测负载和当前负载的对比结果更新当前负载，最后结合当前负载、系统使用率、Kubernetes自带模型获取目标副本数，实现容器的调整；本发明所占用的资源较少，且能够改善响应延迟。

2、本发明在训练获取负载预测模型时，根据历史负载序列的数据量选择调用空闲节点或者公有云平台，通过空闲节点或者公有云平台的介入，提高数据处理效率。

附图说明

图1为本发明的工作步骤示意图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在互联网时代，业务系统的弹性属性对保证其SLA(Service Level Agreement)至关重要。所谓弹性，即当访问量增加，系统压力增大时，业务系统相关资源能够及时得到扩充，保证服务质量QoS(Quality of Service)；而当访问量下降，系统压力降低时，业务系统能回收相关资源，达到提高资源利用率的目的。

另一方面，在互联网时代，业务上云已是大势所趋，而容器技术凭借其“轻量级”，“快响应”，“易移植”等特点得到了越来越广泛的应用，正逐渐成为云计算基础设施层面建设的新趋势。开源引擎docker作为容器技术的代表，可以将应用软件及其依赖的环境打包起来，以标准镜像的形式交付，部署在任何装有docker的操作系统上，从而实现“一次构建，到处运行”的理念，也为构建业务系统的弹性伸缩机制提供了基础。Kubernetes通过集群管理技术对集群中的Docker主机资源进行统一管理和容器的编排调度。但是Kubernetes中的弹性伸缩采用的是响应式策略，存在明显的滞后性，即当负载超出业务系统所能承受范围时，业务系统被动做出改变，再加上容器的启动，应用系统的启动都需要一定的时间，因此无法实时响应业务需求，在一段时间内无法保证服务质量，对业务系统的使用造成负面影响。

本发明解决的就是在容器云环境下，基于Kubernetes的预测式弹性伸缩问题。

Kubernetes中的弹性伸缩采用的是响应式策略，存在明显的滞后性，在一段时间内无法保证服务质量，对业务系统的使用造成负面影响；现有技术中，西南石油大学的陈雁等在Kubernetes中引入弹性伸缩容忍度的概念，提出步长容忍度算法，提高系统的可靠性与灵活性；广西大学的闫承鑫等利用灰色预测算法，研究了面向突变负载的容器云服务弹性供给服务策略；西安邮电大学的杨茂等采用指数平滑法进行负载预测，改善响应延迟；现有技术所用方法占用资源较多，且响应延迟改善不明显；本发明中引入了负载预测模型，通过负载预测模型预测负载，结合预测负载和当前负载对容器进行调整，实现弹性伸缩的目的。

请参阅图1，本申请提供了基于Kubernetes的预测式弹性伸缩方法，包括：

历史负载序列结合公有云平台或者空闲节点建立或者更新负载预测模型；且负载预测模型基于时间序列模型或者人工智能模型建立；

通过更新后的历史负载序列对负载预测模型进行更新。

本申请考虑到建立或者更新负载预测模型是需要一定算力的，仅在Kubernetes的控制节点上进行计算可能会降低Kubernetes的工作效率，因此考虑在Kubernetes的控制节点负载较大的情况下，通过公有云平台或者其他空闲节点来建立和更新负载预测模型，以保证负载预测模型的获取效率和Kubernetes的工作效率。

本申请中获取目标副本数的过程具体为：将负载预测模型计算处的预测负载，取预测负载和当前负载中的较大值，然后较大值结合Kubernetes自带的算法计算出目标副本数。

本申请中根据目标副本数对容器进行调整，主要利用Kubernetes自带机制，结合系统资源使用率和目标资源使用率，计算得到需要的容器副本数，根据生成对应数量的容器副本。

在一个实施例中，根据历史负载序列选择空闲节点或者公有云平台，包括：

获取历史负载序列的数据总量，并标记为LSZ；

获取空闲节点的数据处理量，并标记为KSC；

在一个实施例中，根据基于人工智能模型建立的负载预测模型获取预测负载，包括：

在一个具体的实施例中，基于人工智能模型建立负载预测模型，包括：

本实施例中的时序参数序列与下一时刻的负载值整合成标准数据，才能够保证获取的负载训练模型具有预测功能。

本申请中的负载预测模型基于时间序列模型建立，具体是基于自回归移动平均模型建立，自回归移动平均模型是自回归模型和移动平均模型的组合；

自回归移动平均模型定义为：

表示为ARMA(p，q)；其中，p为自回归阶数，q为移动平均阶数。

自回归模型是研究当前时间点和过去时间点之间的数据关系，通过自身前面部分的数据和后面部分的数据之间的相关关系(自相关)来建立回归方程，是历史时序值的线性组合，自回归模型定义为：

为自回归系数，p为自回归阶数。

移动平均模型通过将白噪声加权，得到移动平均方程，是历史白噪声的线性组合，解决的是随机变动，即噪声问题；移动平均模型定义为：

其中，

为移动回归系数，q为移动平均阶数。

值得注意的是，自回归移动平均模型要求时间序列是稳定的，对于不稳定的时间序列，可以通过差分方式使其达到稳定状态，即引入差分次数将自回归移动平均模型变换为差分自回归移动平均模型。

也就是当历史负载序列不稳定时，则引入差分次数将自回归移动平均模型变换为差分自回归移动平均模型，表示为ARMA(p，d，q)；差分自回归移动平均模型的建立包括：

步骤11：获取历史负载序列；

步骤13：确定p和q；

步骤14：通过参数估计方法进行参数拟合(通过一些算法对需要的参数进行拟合)；其中，参数估计方法包括最小二乘法和最大似然法；

步骤15：将p、q和拟合的参数带入模型公式中计算预测值，并与真实值对比核验。

在Kubernetes中应用预测式弹性伸缩方法，其核心思想是用预测模型计算得出的预测负载值去替代Kubernetes中性能采集器收集到的实际负载值，从而提前做好容器副本数增加或减少的准备。这样的方法在扩容阶段，即流量上升阶段较为合理，但是在某些时段也面临着一些问题：

1)在缩容阶段可以用同样的方法做预测，但缩容阶段没有延迟相应造成的降低服务质量问题，且预测式缩容可能会导致容器副本数下降导致服务质量降低。

2)遇到突发流量的问题，预测式扩容对于这种突发流量很难做出正确判断。

为了解决上面两个问题，在每次预测的过程中加入一个校验环节，将预测值和真实值做比较，取较大值带入最终计算；也就是说，负载预测模型和Kubernetes原有的内置算法是同时运行的，相互兼容，对上述方法中用到的参数定义见表1。

表1预测式方法的变量及定义

参数	描述
		Webdata	历史负载序列
Util(present)	系统当前负载
		Util(predict)	系统预测负载
usageRatio	系统利用率

以表1定义的参数为例，说明本申请技术方案的工作步骤：

步骤21：创建Webdata；

步骤22：利用Webdata和负载预测模型获取Util(predict)；

步骤23：读取Util(present)；

步骤24：将Util(predict)大于当前负载，则将Util(predict)赋值给Util(present)；当Util(predict)小于等于Util(present)时，Util(present)不变；通过公式usageRatio＝utilization/targetUtilization获取usageRatio；

步骤25：用新的Util(predict)、usageRatio结合Kubernetes内置算法模型，计算出容器新的副本数，根据新的副本数进行后续相关操作；

步骤26：将新的Util(predict)补充进Webdata中，然后返回步骤21。

上述公式中的部分数据均是去除量纲取其数值计算，公式是由采集的大量数据经过软件模拟得到最接近真实情况的一个公式；公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者通过大量数据模拟获得。

本发明的工作原理：

历史负载序列结合公有云平台或者空闲节点建立或者更新负载预测模型；基于负载预测模型获取预测负载，并结合预测负载对当前负载重新定义，同时计算系统使用率。

当前负载、系统使用率结合Kubernetes自带模型获取目标副本数，根据目标副本数对容器进行调整，同时将当前负载更新至历史负载序列中；通过更新后的历史负载序列对负载预测模型进行更新。

以上实施例仅用以说明本发明的技术方法而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方法进行修改或等同替换，而不脱离本发明技术方法的精神和范围。

Claims

1.基于Kubernetes的预测式弹性伸缩方法，其特征在于，包括：

通过更新后的历史负载序列对负载预测模型进行更新；

所述时间序列模型包括差分自回归移动平均模型，且差分自回归移动平均模型根据自回归模型和移动平均模型获取；

所述差分自回归移动平均模型的建立包括：

步骤11：获取历史负载序列；

步骤12：对历史负载序列进行预处理，当历史负载序列是非稳定序列时，则通过

阶差分运算转换为平稳序列；

步骤13：确定p和q；其中，p和q的确定方法包括ACF或者PACF；

步骤15：利用训练好的模型计算预测值，并与真实值对比核验；

根据基于所述人工智能模型建立的负载预测模型获取预测负载，包括：

将时序参数序列输入至负载预测模型中获取下一时刻的预测负载；

基于所述人工智能模型建立负载预测模型，包括：

2.根据权利要求1所述的基于Kubernetes的预测式弹性伸缩方法，其特征在于，根据所述历史负载序列选择空闲节点或者公有云平台，包括：

获取历史负载序列的数据总量，并标记为LSZ；

获取空闲节点的数据处理量，并标记为KSC；

根据公式JPX=LSZ/(m×KSC)+1获取节点评估系数JPX；其中，m为空闲节点数量；

3.根据权利要求1所述的基于Kubernetes的预测式弹性伸缩方法，其特征在于，结合所述预测负载对当前负载重新定义，包括：

基于负载预测模型获取预测负载；

读取系统中预测负载对应时刻的当前负载；

4.根据权利要求1所述的基于Kubernetes的预测式弹性伸缩方法，其特征在于，通过所述当前负载对历史负载序列进行更新，并通过更新后的历史负载序列完成负载预测模型的更新，再通过负载预测模型进行新一阶段计算。