CN111385142A

CN111385142A - 基于Kubernetes的自适应伸缩web容器的方法

Info

Publication number: CN111385142A
Application number: CN202010092969.1A
Authority: CN
Inventors: 蒋溢; 何志刚; 熊安萍; 祝清意
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-02-14
Filing date: 2020-02-14
Publication date: 2020-07-07
Anticipated expiration: 2040-02-14
Also published as: CN111385142B

Abstract

本发明涉及一种基于Kubernetes的自适应伸缩web容器的方法，属于云计算技术领域，包括步骤：S1：通过web容器的请求特征，采用arima预测模型分析web请求到达率，构建web容器的请求预测模型，以获取web请求分布规律；S2：根据S1获取到web容器请求到达率和执行时间，并利用M/M/m排队网络，生成web容器自适应动态伸缩策略；S3：Kubernetes调度器依据web容器动态伸缩需求，提前配置扩容或缩容。本发明能够提前对web容器做好动态伸缩的配置，以保证请求高峰期的服务质量，同时提升容器资源利用率，从而提高用户体验，提高企业收益；预测过程和扩缩容过程无需用户干预，对用户友好。

Description

基于Kubernetes的自适应伸缩web容器的方法

技术领域

本发明属于云计算技术领域，涉及基于Kubernetes的自适应伸缩web容器的方法。

背景技术

容器技术主要包含应用程序打包、资源隔离、资源限制等技术，使得容器化的应用具有了轻量、易于部署和移植、弹性伸缩等特点，简化了应用程序的交付流程和管理。与传统的虚拟化技术相比，容器不是对硬件进行虚拟化处理，而是直接运行于宿主机的内核，因此容器的启动速度快、资源利用率高、性能开销小。企业可以通过容器技术节约成本、降低风险、快速部署和灵活切换云服务提供商；开发者可以快速构建开发环境并实现共享，项目成员之间可以快速复制出一套完全一致的开发环境；运维人员可以快速部署运行服务，缩短业务的上线周期、根据业务的负载进行弹性扩容，提供更好的服务等等。弹性是云计算领域中最重要的特性之一，所谓弹性，即云端的可用资源能够随着用户的需求灵活变化，自由伸缩，在负载高峰或低谷期，均能匹配适量的资源，既保证了服务质量，也避免资源浪费。

容器云弹性伸缩器的核心功能是对每个主机和容器的资源进行收集、统计，并与提前设置好的阈值进行对比，高于阈值则扩容应用，低于阈值则缩容应用。以使用最广泛的Kubernetes平台为例，其Auto-scaler伸缩策略主要有HPA(水平扩容),VPA(垂直扩容),Cluster-Autoscaler(节点伸缩)等。这些伸缩策略大多基于如内存，cpu，带宽等资源的监控，，资源指标有时并不能准确的反映应用负载的变化，如用户更关心的响应时间；此外，这些策略一般基于阈值进行响应式伸缩，而在应用负载高峰，从触发扩容到响应用户请求需要一段延时，而这段时间内的服务质量无法得到保证，对于负载有规律性的应用而言，容易频繁伸缩，造成系统抖动。

发明内容

有鉴于此，本发明的目的在于提供一种一种基于Kubernetes的自适应伸缩web容器的方法与系统，旨在通过构建模型预测web容器的请求到达率，并建立web容器动态伸缩策略，从而提升服务质量。

为达到上述目的，本发明提供如下技术方案：

一种基于Kubernetes的自适应伸缩web容器的方法，包括如下步骤：

S1：通过web容器的请求特征，采用arima预测模型分析web请求到达率，构建web容器的请求预测模型，以获取web请求分布规律；

S2：根据S1获取到web容器请求到达率和执行时间，并利用M/M/s排队网络，生成web容器自适应动态伸缩策略；

S3：Kubernetes调度器依据web容器动态伸缩数量，提前配置扩容或缩容。

进一步，所述步骤S1具体包括以下步骤：

S11：部署数据采集器采集web容器请求信息，存储于时间序列数据库内并根据相关性系数过滤请求信息；

设采集间隙为τ₀，采集的请求信息为{X(t)；t∈T}，T为请求采集时间索引，X(t)为采集的请求量；计算X(t)与X(t-i)的相关系数为：

取出相关性排名Top k的请求信息；

S12：根据S11中的请求信息构建在线web容器请求arima预测模型，并对请求到达率进行预测，请求到达率记为λ。

进一步，步骤S12中所述在线web容器请求arima预测模型构建的具体操作步骤为：

S121：输入原始请求序列，建立散点图、自相关函数图和偏自相关函数图；

S122：平稳性检验。利用图像和游程检验法来检验序列平稳性。若不平稳，则进行差分操作，直到通过平稳性检验，差分次数设为d；

S123：根据arima识别规则(如表1所示)对已经平稳的请求序列建立对应的arima预测模型；

S124：设模型最终拟合的预测方程为：

其中p为自回归项，q为移动平均项，d为差分次数，将预测的时间索引代入上式中求得预测值，并还原d次差分即得请求到达率λ。

进一步，所述步骤S2具体包括以下步骤：

S21：根据S12获取到的请求到达率λ和监控获取到的web容器请求执行时间T_s建立M/M/m排队网络：第一个M表示web请求的相继到达时间服从参数为λ的负指数分布，第二个M表示web服务时间服从参数为μ的负指数分布,m则表示web容器数量，且

S22：计算S21中排队网络的响应时间，拒绝率并判断是否符合SLA约定，若不符合，则迭代计算，并最终找到满足SLA协议的最小容器数量。

进一步，步骤S22中，排队网络的响应时间，拒绝率的计算过程如式(4)所示：

M/M/m排队网络的平均服务时间μ_n、队长概率分布p_n、平均排队长L_q，请求等待时间T_q计算分别如下，n这里代表请求的数量：

由Little公式可得，

故请求响应时间为：

L(λ,μ,m)＝T_q+T_s (8)

考虑时间对上述表达式的影响，则式(8)可以改写为：

L_t(λ,μ,m)＝T_q+T_s (9)

拒绝率表达式为：

P_r(L_t(λ,μ,m)＞T)≤K％ (10)

其中T和K分别为SLA协议中要求的最大响应时间和拒绝率的阈值。

假设每个web容器在T时间能够处理k个请求，m个web容器在T时间则能处理m*k个请求，所以队长不超过m*k的情况下，要求的SLA就能得到满足。根据假设，则可得与(10)式对应的队长分布表达式：

进一步，所述步骤S3具体包括以下步骤：

S31：计算容器镜像的下载时间T_image和容器的启动时间T_container；

S32：判断当前伸缩类型；若需扩容，则调度器提前2*(T_image+T_container)的时间修改容器副本数量；若需缩容，则调度器按时修改容器副本数量。

本发明的有益效果在于：主要针对web容器的http请求进行监控，构建模型预测请求到达率，利用排队论获取合适的容器数目，能够提前对web容器做好动态伸缩的配置，以保证请求高峰期的服务质量，同时提升容器资源利用率，从而提高用户体验，提高企业收益；预测过程和扩缩容过程无需用户干预，对于用户十分友好。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统总体框架图；

图2为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统流程图；

图3为arima预测模型流程图；

图4为获取容器数量算法图；

图5为M/M/m排队网络图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明提出的一种基于Kubernetes的自适应伸缩web容器的方法与系统，是在接受web请求的时候由请求采集模块负责记录请求的时间、大小、响应时间等信息且存储于时序数据库中,结合预测模型和排队论确定合适的容器数量。

图1为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统总体框架图，图2是本发明一种基于Kubernetes的自适应伸缩web容器的方法与系统流程图，包括以下步骤：

步骤101，接受输入web容器，部署web服务；

步骤102，部署数据采集器采集服务入口的http请求信息，包括请求到达时间、请求大小、请求响应时间、请求状态码等信息，并存储于时序数据库prometheus中；

步骤103，从时序数据库中读取请求序列数据，并计算与当前请求信息的相关性并从高到低排序，取出Top k的请求序列数据，相关性计算公式如下：

步骤104，对请求序列数据按照图3所示构建arima预测模型，具体操作步骤为：

步骤1041：输入原始请求序列，建立散点图、自相关函数图和偏自相关函数图；

步骤1042：平稳性检验。利用图像和游程检验法来检验序列平稳性。若不平稳，则进行差分操作，直到通过平稳性检验，差分次数设为d；

步骤1043：根据arima识别规则(如表1所示)对已经平稳的请求序列建立对应的arima预测模型；

表1 arima模型识别规则表

步骤1044：设模型最终拟合的预测方程为：

步骤105，判断模型是否建立成功，若建立成功则到达步骤106，反之则到达步骤115；

步骤106，利用步骤104构建的预测模型预测下一个时间索引的请求到达率λ；

步骤107，通过监控收集web容器最近一段时间内的请求执行时间信息并计算其平均值T_s；

步骤108，按照步骤106的请求率λ、步骤107的请求平均执行时间T_s、当前组成服务的web容器数量m构建M/M/m排队网络，如图5所示，请求到达率和服务时间均服从负指数分布；第一个M表示web请求的相继到达时间服从参数为λ的负指数分布，第二个M表示web服务时间服从参数为μ的负指数分布,m则表示web容器数量，且

步骤109，根据步骤108构建的M/M/m排队网络，计算该网络的响应时间L_t(λ,μ,m)和拒绝率P_r(L_t(λ,μ,m)＞T)；

步骤110，判断是否满足SLA协议中要求的响应时间T和拒绝率K％,若不满足则说明当前web容器的数量不合适，则到达步骤111；若满足则到达步骤112；

步骤111，修改m的个数，如图4所示，缩小容器数量的搜索区间，得到新的m并反复进行步骤108的建模和步骤109的计算，直到得到满足SLA协议的m；

如图5所示，M/M/m排队网络的平均服务时间μ_n、队长概率分布p_n、平均排队长L_q，请求等待时间T_q计算分别如下，n这里代表请求的数量：

由Little公式可得，

故请求响应时间为：

L(λ,μ,m)＝T_q+T_s (8)

考虑时间对上述表达式的影响，则式(8)可以改写为：

L_t(λ,μ,m)＝T_q+T_s (9)

拒绝率表达式为：

P_r(L_t(λ,μ,m)＞T)≤K％ (10)

步骤112，判断需要进行伸缩，若是不需要，则到达步骤115；若需要，表示进行扩容或者缩容，则到达步骤113；

步骤113，确定伸缩时机。计算容器镜像的下载时间T_image和web容器的启动时间T_container，判断当前伸缩类型。若是扩容，则调度器提前2*(T_image+T_container)的时间修改容器副本数量；若是缩容，则调度器按时修改容器副本数量；否则不执行任何操作；

步骤114，按照步骤113中确定的伸缩时机，修改web容器的数量；

步骤115，判断系统是否需要结束,否则重复进行以上步骤,通过在线调整预测模型和排队网络最终得到满足SLA要求的web容器数目。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。