CN111385142A - 基于Kubernetes的自适应伸缩web容器的方法 - Google Patents

基于Kubernetes的自适应伸缩web容器的方法 Download PDF

Info

Publication number
CN111385142A
CN111385142A CN202010092969.1A CN202010092969A CN111385142A CN 111385142 A CN111385142 A CN 111385142A CN 202010092969 A CN202010092969 A CN 202010092969A CN 111385142 A CN111385142 A CN 111385142A
Authority
CN
China
Prior art keywords
request
web
container
time
web container
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010092969.1A
Other languages
English (en)
Other versions
CN111385142B (zh
Inventor
蒋溢
何志刚
熊安萍
祝清意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202010092969.1A priority Critical patent/CN111385142B/zh
Publication of CN111385142A publication Critical patent/CN111385142A/zh
Application granted granted Critical
Publication of CN111385142B publication Critical patent/CN111385142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于Kubernetes的自适应伸缩web容器的方法,属于云计算技术领域,包括步骤:S1:通过web容器的请求特征,采用arima预测模型分析web请求到达率,构建web容器的请求预测模型,以获取web请求分布规律;S2:根据S1获取到web容器请求到达率和执行时间,并利用M/M/m排队网络,生成web容器自适应动态伸缩策略;S3:Kubernetes调度器依据web容器动态伸缩需求,提前配置扩容或缩容。本发明能够提前对web容器做好动态伸缩的配置,以保证请求高峰期的服务质量,同时提升容器资源利用率,从而提高用户体验,提高企业收益;预测过程和扩缩容过程无需用户干预,对用户友好。

Description

基于Kubernetes的自适应伸缩web容器的方法
技术领域
本发明属于云计算技术领域,涉及基于Kubernetes的自适应伸缩web容器的方法。
背景技术
容器技术主要包含应用程序打包、资源隔离、资源限制等技术,使得容器化的应用具有了轻量、易于部署和移植、弹性伸缩等特点,简化了应用程序的交付流程和管理。与传统的虚拟化技术相比,容器不是对硬件进行虚拟化处理,而是直接运行于宿主机的内核,因此容器的启动速度快、资源利用率高、性能开销小。企业可以通过容器技术节约成本、降低风险、快速部署和灵活切换云服务提供商;开发者可以快速构建开发环境并实现共享,项目成员之间可以快速复制出一套完全一致的开发环境;运维人员可以快速部署运行服务,缩短业务的上线周期、根据业务的负载进行弹性扩容,提供更好的服务等等。弹性是云计算领域中最重要的特性之一,所谓弹性,即云端的可用资源能够随着用户的需求灵活变化,自由伸缩,在负载高峰或低谷期,均能匹配适量的资源,既保证了服务质量,也避免资源浪费。
容器云弹性伸缩器的核心功能是对每个主机和容器的资源进行收集、统计,并与提前设置好的阈值进行对比,高于阈值则扩容应用,低于阈值则缩容应用。以使用最广泛的Kubernetes平台为例,其Auto-scaler伸缩策略主要有HPA(水平扩容),VPA(垂直扩容),Cluster-Autoscaler(节点伸缩)等。这些伸缩策略大多基于如内存,cpu,带宽等资源的监控,,资源指标有时并不能准确的反映应用负载的变化,如用户更关心的响应时间;此外,这些策略一般基于阈值进行响应式伸缩,而在应用负载高峰,从触发扩容到响应用户请求需要一段延时,而这段时间内的服务质量无法得到保证,对于负载有规律性的应用而言,容易频繁伸缩,造成系统抖动。
发明内容
有鉴于此,本发明的目的在于提供一种一种基于Kubernetes的自适应伸缩web容器的方法与系统,旨在通过构建模型预测web容器的请求到达率,并建立web容器动态伸缩策略,从而提升服务质量。
为达到上述目的,本发明提供如下技术方案:
一种基于Kubernetes的自适应伸缩web容器的方法,包括如下步骤:
S1:通过web容器的请求特征,采用arima预测模型分析web请求到达率,构建web容器的请求预测模型,以获取web请求分布规律;
S2:根据S1获取到web容器请求到达率和执行时间,并利用M/M/s排队网络,生成web容器自适应动态伸缩策略;
S3:Kubernetes调度器依据web容器动态伸缩数量,提前配置扩容或缩容。
进一步,所述步骤S1具体包括以下步骤:
S11:部署数据采集器采集web容器请求信息,存储于时间序列数据库内并根据相关性系数过滤请求信息;
设采集间隙为τ0,采集的请求信息为{X(t);t∈T},T为请求采集时间索引,X(t)为采集的请求量;计算X(t)与X(t-i)的相关系数为:
Figure BDA0002384322470000021
取出相关性排名Top k的请求信息;
S12:根据S11中的请求信息构建在线web容器请求arima预测模型,并对请求到达率进行预测,请求到达率记为λ。
进一步,步骤S12中所述在线web容器请求arima预测模型构建的具体操作步骤为:
S121:输入原始请求序列,建立散点图、自相关函数图和偏自相关函数图;
S122:平稳性检验。利用图像和游程检验法来检验序列平稳性。若不平稳,则进行差分操作,直到通过平稳性检验,差分次数设为d;
S123:根据arima识别规则(如表1所示)对已经平稳的请求序列建立对应的arima预测模型;
S124:设模型最终拟合的预测方程为:
Figure BDA0002384322470000022
其中p为自回归项,q为移动平均项,d为差分次数,将预测的时间索引代入上式中求得预测值,并还原d次差分即得请求到达率λ。
进一步,所述步骤S2具体包括以下步骤:
S21:根据S12获取到的请求到达率λ和监控获取到的web容器请求执行时间Ts建立M/M/m排队网络:第一个M表示web请求的相继到达时间服从参数为λ的负指数分布,第二个M表示web服务时间服从参数为μ的负指数分布,m则表示web容器数量,且
Figure BDA0002384322470000023
S22:计算S21中排队网络的响应时间,拒绝率并判断是否符合SLA约定,若不符合,则迭代计算,并最终找到满足SLA协议的最小容器数量。
进一步,步骤S22中,排队网络的响应时间,拒绝率的计算过程如式(4)所示:
M/M/m排队网络的平均服务时间μn、队长概率分布pn、平均排队长Lq,请求等待时间Tq计算分别如下,n这里代表请求的数量:
Figure BDA0002384322470000031
Figure BDA0002384322470000032
Figure BDA0002384322470000033
由Little公式可得,
Figure BDA0002384322470000034
故请求响应时间为:
L(λ,μ,m)=Tq+Ts (8)
考虑时间对上述表达式的影响,则式(8)可以改写为:
Lt(λ,μ,m)=Tq+Ts (9)
拒绝率表达式为:
Pr(Lt(λ,μ,m)>T)≤K% (10)
其中T和K分别为SLA协议中要求的最大响应时间和拒绝率的阈值。
假设每个web容器在T时间能够处理k个请求,m个web容器在T时间则能处理m*k个请求,所以队长不超过m*k的情况下,要求的SLA就能得到满足。根据假设,则可得与(10)式对应的队长分布表达式:
Figure BDA0002384322470000035
进一步,所述步骤S3具体包括以下步骤:
S31:计算容器镜像的下载时间Timage和容器的启动时间Tcontainer
S32:判断当前伸缩类型;若需扩容,则调度器提前2*(Timage+Tcontainer)的时间修改容器副本数量;若需缩容,则调度器按时修改容器副本数量。
本发明的有益效果在于:主要针对web容器的http请求进行监控,构建模型预测请求到达率,利用排队论获取合适的容器数目,能够提前对web容器做好动态伸缩的配置,以保证请求高峰期的服务质量,同时提升容器资源利用率,从而提高用户体验,提高企业收益;预测过程和扩缩容过程无需用户干预,对于用户十分友好。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统总体框架图;
图2为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统流程图;
图3为arima预测模型流程图;
图4为获取容器数量算法图;
图5为M/M/m排队网络图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明提出的一种基于Kubernetes的自适应伸缩web容器的方法与系统,是在接受web请求的时候由请求采集模块负责记录请求的时间、大小、响应时间等信息且存储于时序数据库中,结合预测模型和排队论确定合适的容器数量。
图1为本发明所述基于Kubernetes的自适应伸缩web容器的方法与系统总体框架图,图2是本发明一种基于Kubernetes的自适应伸缩web容器的方法与系统流程图,包括以下步骤:
步骤101,接受输入web容器,部署web服务;
步骤102,部署数据采集器采集服务入口的http请求信息,包括请求到达时间、请求大小、请求响应时间、请求状态码等信息,并存储于时序数据库prometheus中;
步骤103,从时序数据库中读取请求序列数据,并计算与当前请求信息的相关性并从高到低排序,取出Top k的请求序列数据,相关性计算公式如下:
设采集间隙为τ0,采集的请求信息为{X(t);t∈T},T为请求采集时间索引,X(t)为采集的请求量;计算X(t)与X(t-i)的相关系数为:
Figure BDA0002384322470000051
步骤104,对请求序列数据按照图3所示构建arima预测模型,具体操作步骤为:
步骤1041:输入原始请求序列,建立散点图、自相关函数图和偏自相关函数图;
步骤1042:平稳性检验。利用图像和游程检验法来检验序列平稳性。若不平稳,则进行差分操作,直到通过平稳性检验,差分次数设为d;
步骤1043:根据arima识别规则(如表1所示)对已经平稳的请求序列建立对应的arima预测模型;
表1 arima模型识别规则表
Figure BDA0002384322470000052
Figure BDA0002384322470000061
步骤1044:设模型最终拟合的预测方程为:
Figure BDA0002384322470000062
其中p为自回归项,q为移动平均项,d为差分次数,将预测的时间索引代入上式中求得预测值,并还原d次差分即得请求到达率λ。
步骤105,判断模型是否建立成功,若建立成功则到达步骤106,反之则到达步骤115;
步骤106,利用步骤104构建的预测模型预测下一个时间索引的请求到达率λ;
步骤107,通过监控收集web容器最近一段时间内的请求执行时间信息并计算其平均值Ts
步骤108,按照步骤106的请求率λ、步骤107的请求平均执行时间Ts、当前组成服务的web容器数量m构建M/M/m排队网络,如图5所示,请求到达率和服务时间均服从负指数分布;第一个M表示web请求的相继到达时间服从参数为λ的负指数分布,第二个M表示web服务时间服从参数为μ的负指数分布,m则表示web容器数量,且
Figure BDA0002384322470000063
步骤109,根据步骤108构建的M/M/m排队网络,计算该网络的响应时间Lt(λ,μ,m)和拒绝率Pr(Lt(λ,μ,m)>T);
步骤110,判断是否满足SLA协议中要求的响应时间T和拒绝率K%,若不满足则说明当前web容器的数量不合适,则到达步骤111;若满足则到达步骤112;
步骤111,修改m的个数,如图4所示,缩小容器数量的搜索区间,得到新的m并反复进行步骤108的建模和步骤109的计算,直到得到满足SLA协议的m;
如图5所示,M/M/m排队网络的平均服务时间μn、队长概率分布pn、平均排队长Lq,请求等待时间Tq计算分别如下,n这里代表请求的数量:
Figure BDA0002384322470000064
Figure BDA0002384322470000065
Figure BDA0002384322470000071
由Little公式可得,
Figure BDA0002384322470000072
故请求响应时间为:
L(λ,μ,m)=Tq+Ts (8)
考虑时间对上述表达式的影响,则式(8)可以改写为:
Lt(λ,μ,m)=Tq+Ts (9)
拒绝率表达式为:
Pr(Lt(λ,μ,m)>T)≤K% (10)
其中T和K分别为SLA协议中要求的最大响应时间和拒绝率的阈值。
假设每个web容器在T时间能够处理k个请求,m个web容器在T时间则能处理m*k个请求,所以队长不超过m*k的情况下,要求的SLA就能得到满足。根据假设,则可得与(10)式对应的队长分布表达式:
Figure BDA0002384322470000073
步骤112,判断需要进行伸缩,若是不需要,则到达步骤115;若需要,表示进行扩容或者缩容,则到达步骤113;
步骤113,确定伸缩时机。计算容器镜像的下载时间Timage和web容器的启动时间Tcontainer,判断当前伸缩类型。若是扩容,则调度器提前2*(Timage+Tcontainer)的时间修改容器副本数量;若是缩容,则调度器按时修改容器副本数量;否则不执行任何操作;
步骤114,按照步骤113中确定的伸缩时机,修改web容器的数量;
步骤115,判断系统是否需要结束,否则重复进行以上步骤,通过在线调整预测模型和排队网络最终得到满足SLA要求的web容器数目。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于Kubernetes的自适应伸缩web容器的方法,其特征在于:包括以下步骤:
S1:通过web容器的请求特征,采用arima预测模型分析web请求到达率,构建web容器的请求预测模型,以获取web请求分布规律;
S2:根据S1获取到web容器请求到达率和执行时间,并利用M/M/m排队网络,生成web容器自适应动态伸缩策略;
S3:Kubernetes调度器依据web容器动态伸缩需求,提前配置扩容或缩容。
2.根据权利要求1所述的基于Kubernetes的自适应伸缩web容器的方法,其特征在于:所述步骤S1具体包括:
S11:部署数据采集器采集web容器请求信息,存储于时间序列数据库内并根据相关性系数过滤请求信息;
S12:根据步骤S11中的请求信息构建在线web容器请求arima预测模型,并对请求到达率进行预测,请求到达率记为λ。
3.根据权利要求2所述的基于Kubernetes的自适应伸缩web容器的方法,其特征在于:步骤S12中所述在线web容器请求arima预测模型构建的具体操作步骤为:
S121:输入原始请求序列,建立散点图、自相关函数图和偏自相关函数图;
S122:平稳性检验;利用图像和游程检验法来检验序列平稳性;若不平稳,则进行差分操作,直到通过平稳性检验,差分次数设为d;
S123:根据arima识别规则(如表1所示)对已经平稳的请求序列建立对应的arima预测模型;
S124:设模型最终拟合的预测方程为:
Figure FDA0002384322460000011
其中p为自回归项,q为移动平均项,d为差分次数,将预测的时间索引代入上式中求得预测值,并还原d次差分即得请求到达率λ。
4.根据权利要求3所述的基于Kubernetes的自适应伸缩web容器的方法,其特征在于:所述步骤S2具体包括:
S21:根据S12获取到的请求到达率λ和web容器请求执行时间Ts建立M/M/m排队网络,第一个M表示web请求到达时间服从参数为λ的负指数分布,第二个M表示web服务时间服从参数为μ的负指数分布,m则表示web容器数量,且
Figure FDA0002384322460000012
S22:计算S21中排队网络的响应时间、拒绝率并判断是否符合SLA协议,若不符合,则迭代计算,并最终找到满足SLA协议的最小容器数量。
5.根据权利要求4所述的一种基于Kubernetes的自适应伸缩web容器的方法,其特征在于:步骤S22中,排队网络的响应时间,拒绝率的计算过程如下式所示:
M/M/m排队网络的平均服务时间μn、队长概率分布pn、平均排队长Lq,请求等待时间Tq计算分别如下,n这里代表请求的数量:
Figure FDA0002384322460000021
Figure FDA0002384322460000022
Figure FDA0002384322460000023
由Little公式可得,
Figure FDA0002384322460000024
故请求响应时间为:
L(λ,μm)=Tq+Ts
考虑时间对上述表达式的影响,则上式改写为:
Lt(λ,μ,m)=Tq+Ts
拒绝率表达式为:
Pr(Lt(λ,μ,m)>T)≤K%
其中T和K分别为SLA协议中要求的最大响应时间和拒绝率的阈值;
假设每个web容器在T时间能够处理k个请求,m个web容器在T时间则能处理m*k个请求,所以队长不超过m*k的情况下,要求的SLA就能得到满足;根据假设,得与上式对应的队长分布表达式:
Figure FDA0002384322460000025
6.根据权利要求5所述的一种基于Kubernetes的自适应伸缩web容器的方法,其特征在于:所述步骤S3具体包括:
S31:计算容器镜像的下载时间Timage和web容器的启动时间Tcontainer
S32:判断当前伸缩类型;若需扩容,则调度器提前2*(Timage+Tcontainer)的时间修改容器副本数量;若需缩容,则调度器按时修改容器副本数量。
CN202010092969.1A 2020-02-14 2020-02-14 基于Kubernetes的自适应伸缩web容器的方法 Active CN111385142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010092969.1A CN111385142B (zh) 2020-02-14 2020-02-14 基于Kubernetes的自适应伸缩web容器的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010092969.1A CN111385142B (zh) 2020-02-14 2020-02-14 基于Kubernetes的自适应伸缩web容器的方法

Publications (2)

Publication Number Publication Date
CN111385142A true CN111385142A (zh) 2020-07-07
CN111385142B CN111385142B (zh) 2022-04-12

Family

ID=71215191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010092969.1A Active CN111385142B (zh) 2020-02-14 2020-02-14 基于Kubernetes的自适应伸缩web容器的方法

Country Status (1)

Country Link
CN (1) CN111385142B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291104A (zh) * 2020-12-30 2021-01-29 望海康信(北京)科技股份公司 微服务自动伸缩系统、方法及相应设备和存储介质
CN112333095A (zh) * 2021-01-06 2021-02-05 杭州网银互联科技股份有限公司 基于kubernetes伸缩特性的软件定义广域网路由计算方法、系统
CN112363825A (zh) * 2020-10-16 2021-02-12 北京五八信息技术有限公司 一种弹性伸缩方法及装置
WO2022267646A1 (zh) * 2021-06-22 2022-12-29 华为云计算技术有限公司 一种容器集的部署方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065663A (zh) * 2014-07-01 2014-09-24 复旦大学 一种基于混合云调度模型的自动伸缩、费用优化的内容分发服务方法
US20150169291A1 (en) * 2013-12-16 2015-06-18 International Business Machines Corporation Systems and methods for scaling a cloud infrastructure
CN107247651A (zh) * 2017-05-09 2017-10-13 中国电子产品可靠性与环境试验研究所 云计算平台监测预警方法和系统
WO2017214986A1 (zh) * 2016-06-17 2017-12-21 华为技术有限公司 一种云应用伸缩方法及装置
CN108920153A (zh) * 2018-05-29 2018-11-30 华南理工大学 一种基于负载预测的Docker容器动态调度方法
CN109800075A (zh) * 2017-11-16 2019-05-24 航天信息股份有限公司 集群管理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150169291A1 (en) * 2013-12-16 2015-06-18 International Business Machines Corporation Systems and methods for scaling a cloud infrastructure
CN104065663A (zh) * 2014-07-01 2014-09-24 复旦大学 一种基于混合云调度模型的自动伸缩、费用优化的内容分发服务方法
WO2017214986A1 (zh) * 2016-06-17 2017-12-21 华为技术有限公司 一种云应用伸缩方法及装置
CN107247651A (zh) * 2017-05-09 2017-10-13 中国电子产品可靠性与环境试验研究所 云计算平台监测预警方法和系统
CN109800075A (zh) * 2017-11-16 2019-05-24 航天信息股份有限公司 集群管理方法及装置
CN108920153A (zh) * 2018-05-29 2018-11-30 华南理工大学 一种基于负载预测的Docker容器动态调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
VITALIY YAKOVYNA,BOHDAN UHRYNOVSKYI: "Software Failures Forecasting by Holt-Winters,ARIMA and NNAR Methods", 《2019 IEEE 14TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCES AND INTERNATION TECHNOLOGIES》 *
Y YANG,L ZHAO: "ElaX:Provisioning Resource Elastically for Containerzed Online Cloud Services", 《2019 IEEE 21ST INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS》 *
马小淋: "一种基于负载特征预测的容器云弹性伸缩策略", 《信息安全研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112363825A (zh) * 2020-10-16 2021-02-12 北京五八信息技术有限公司 一种弹性伸缩方法及装置
CN112291104A (zh) * 2020-12-30 2021-01-29 望海康信(北京)科技股份公司 微服务自动伸缩系统、方法及相应设备和存储介质
CN112333095A (zh) * 2021-01-06 2021-02-05 杭州网银互联科技股份有限公司 基于kubernetes伸缩特性的软件定义广域网路由计算方法、系统
CN112333095B (zh) * 2021-01-06 2021-04-16 杭州网银互联科技股份有限公司 基于kubernetes伸缩特性的软件定义广域网路由计算方法、系统
WO2022267646A1 (zh) * 2021-06-22 2022-12-29 华为云计算技术有限公司 一种容器集的部署方法及装置

Also Published As

Publication number Publication date
CN111385142B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111385142B (zh) 基于Kubernetes的自适应伸缩web容器的方法
CN112000459B (zh) 一种用于服务的扩缩容的方法及相关设备
US20160321331A1 (en) Device and method
WO2022001918A1 (zh) 构建预测模型的方法、装置、计算设备和存储介质
WO2023185090A1 (zh) 基于微服务链路分析和强化学习的调度方法及装置
CN111126621B (zh) 在线模型训练方法及装置
CN110569252B (zh) 一种数据处理系统及方法
KR101965277B1 (ko) 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램
CN113110914A (zh) 一种基于微服务架构的物联网平台构建方法
CN110119399B (zh) 基于机器学习的业务流程优化方法
CN111431996B (zh) 用于资源配置的方法、装置、设备和介质
CN105607952B (zh) 一种虚拟化资源的调度方法及装置
CN107608781B (zh) 一种负载预测方法、装置以及网元
CN113886010A (zh) 容器资源的控制方法、设备及计算机存储介质
WO2022252694A1 (zh) 神经网络优化方法及其装置
CN112579273A (zh) 任务调度方法及装置、计算机可读存储介质
CN115525394A (zh) 容器数量的调整方法及装置
CN111367632B (zh) 一种基于周期特征的容器云调度方法
CN115913967A (zh) 一种云环境下基于资源需求预测的微服务弹性伸缩方法
CN113553138A (zh) 一种云资源调度的方法及装置
CN112000460A (zh) 一种基于改进贝叶斯算法的服务扩缩容的方法及相关设备
KR101324850B1 (ko) 모바일 클라우드를 위한 온톨로지 기반의 가상 머신 할당 장치 및 그 방법
CN116010228B (zh) 面向网络安全扫描的时间预估方法及装置
Shameem et al. An effective resource management in cloud computing
CN110119268B (zh) 基于人工智能的工作流优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant