CN114428666A - 一种基于cpu和内存占用率的智能弹性伸缩方法及系统 - Google Patents

一种基于cpu和内存占用率的智能弹性伸缩方法及系统 Download PDF

Info

Publication number
CN114428666A
CN114428666A CN202210097733.6A CN202210097733A CN114428666A CN 114428666 A CN114428666 A CN 114428666A CN 202210097733 A CN202210097733 A CN 202210097733A CN 114428666 A CN114428666 A CN 114428666A
Authority
CN
China
Prior art keywords
index data
platform
elastic expansion
cpu
set time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210097733.6A
Other languages
English (en)
Inventor
王喆
郭歌
刘承亮
朱韦桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technologies of CARS
Original Assignee
Institute of Computing Technologies of CARS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technologies of CARS filed Critical Institute of Computing Technologies of CARS
Priority to CN202210097733.6A priority Critical patent/CN114428666A/zh
Publication of CN114428666A publication Critical patent/CN114428666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于CPU和内存占用率的智能弹性伸缩方法及系统,方法包括:对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率;根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据;根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。本发明通过对指标数据进行预测实现弹性伸缩调整,以节约平台资源。

Description

一种基于CPU和内存占用率的智能弹性伸缩方法及系统
技术领域
本发明涉及CPU占用率领域,特别是涉及一种基于CPU和内存占用率的智能弹性伸缩方法及系统。
背景技术
K8s平台最大的特点就是能够对部署在平台上的pod进行扩缩容从而应对业务流量的变化。扩缩容的依据一般监测pod的CPU和内存占用率。
随着铁路信息化建设的不断发展,客货运、基础设施运维等大量的应用都在往k8s平台迁移,以支撑越来越多的客户量。铁路信息系统的客户访问具有一定的特殊性和可预测性,比如客运系统售票的高峰在节假日前30天(预售期),即时通信类业务系统的访问高峰通常在上午上班前后,下班前后等等;基础设施运维系统的访问高峰通常在每月或每季度例行检查时段。上述业务系统的流量高峰和低谷可以采用预测算法结合必要的节假日定制进行预测,能够很好的解决资源和服务能力之间的权衡问题。
1、对于K8s平台中pod扩容的处理:传统解决方案中,一般直接根据CPU和内存占用率来直观调整容器扩缩容。因为扩容的方案总是去检查当前是否满足CPU和内存占用率降低的目标,当遇到流量激增再加上pod启动耗时,在一段时间内承载业务流量的pod能力增长跟不上流量增长,会增加服务响应时间影响用户感受。
2、对于K8s平台中pod缩容的处理:传统解决方案中,k8s中Pod的缩容是通过设置一个时间延迟,以应对流量访问高峰过去后,流量短时间内反复造成对pod扩展和缩容的抖动。但是采用一个确定时间延迟并不解决根本问题。
发明内容
本发明的目的是提供一种基于CPU和内存占用率的智能弹性伸缩方法及系统,通过对指标数据进行预测实现弹性伸缩调整,以节约平台资源。
为实现上述目的,本发明提供了如下方案:
一种基于CPU和内存占用率的智能弹性伸缩方法,包括:
对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;
获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率;
根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据;
根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
可选地,所述根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据,具体包括:
根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
可选地,所述根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整,具体包括:
判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果;
若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整;
若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果;
若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整;
若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
可选地,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
一种基于CPU和内存占用率的智能弹性伸缩系统,包括:
配置模块,用于对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;
获取模块,用于获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率;
预测模块,用于根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据;
调整模块,用于根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
可选地,所述预测模块,具体包括:
预测单元,用于根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
可选地,所述调整模块,具体包括:
第一判断单元,用于判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果;
收缩调整单元,用于若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整;
第二判断单元,用于若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果;
扩展调整单元,用于若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整;
保持单元,用于若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
可选地,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的基于CPU和内存占用率的智能弹性伸缩方法及系统,对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;获取被监控对象的指标数据;被监控对象为平台的服务组件;指标数据包括CPU占用率和内存占用率;根据被监控对象的指标数据进行预测,得到设定时间的指标数据;根据设定时间的指标数据、弹性扩展最大阈值和弹性收缩最小阈值对平台进行调整。通过对指标数据进行预测实现弹性伸缩调整,以节约平台资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于CPU和内存占用率的智能弹性伸缩方法流程图;
图2为本发明提供的基于CPU和内存占用率的智能弹性伸缩系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于CPU和内存占用率的智能弹性伸缩方法及系统,通过对指标数据进行预测实现弹性伸缩调整,以节约平台资源。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的一种基于CPU和内存占用率的智能弹性伸缩方法,包括:
步骤101:对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置。
本发明基于k8s平台,通过k8s的API同平台进行数据互通。部署完毕后,在平台中配置被监控对象(需要开展弹性伸缩的目标物)的信息(访问地址、CPU和内存参数获取地址等)。目标物是部署在k8s平台上服务组件,比如web应用的前端、后端、数据库组件或者其他中间件。这些组件要占用一定的系统资源,一般通过CPU和内存占用来评估。
在本发明中基于CPU占用率进行弹性扩展的最小阈值和最大阈值配置,以及弹性收缩的最小阈值和最大阈值配置;同理配置基于内存占用率的相关阈值。具体如表1和表2所示。其中,配置参数是通过配置文件的方式记录配置参数,本发明软件启动时或初始化时会读取配置文件信息。参数是自己设定的,根据项目的不同,参数会略有调整,但也可不变化。
表1 CPU占用率相关阈值表
CPU占用率(最小阈值) CPU占用率(最大阈值)
弹性收缩 20% 30%
弹性扩展 70% 80%
表2内存占用率相关阈值表
内存占用率(最小阈值) 内存占用率(最大阈值)
弹性收缩 30% 40%
弹性扩展 70% 80%
步骤102:获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率。
周期(秒或分钟级)获取被监控对象的指标数据,如某一时刻CPU和内存占用率。
步骤103:根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据。步骤103,具体包括:根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
根据积累的被监控对象的历史指标数据,采用时间序列预测算法Prophet,对未来300秒时间范围内的指标数据进行预测,其中,指标数据就是CPU和内存占用率。预测算法就是prophet算法(开源时间序列预测算法),该算法接收指标历史时间序列输入(时间+数值),以及必要的参数配置,输出为指定时间段的数值预测结果,也就是未来CPU和内存占用率。具体算法思路如下:
时间序列由几部分组成:
y(t)=g(t)+s(t)+h(t)+∈t
其中,g(t)表示趋势项,表示时间序列在非周期上面的变化趋势;s(t)表示周期项,或者称为季节项,一般来说是以周或者年为单位;h(t)表示节假日项,表示时间序列中那些潜在的具有非固定周期的节假日对预测值造成的影响;h(t)是Prophet算法的因素项,代表节假日因素对时间序列数值的影响。∈t即误差项或者称为剩余项,表示模型未预测到的波动,服从高斯分布。y(t)为未来CPU和内存占用率。
(1)趋势函数:
考虑到K8s平台上中间件的使用量的增长具有上限,因此趋势函数选择分段逻辑回归函数;
Figure BDA0003491622030000061
其中,α(t)=(α1(t),…,αS(t))T
其中,C(t)表示承载量:它是一个随时间变化的函数,限定了所能增长的最大值,对于CPU和内存占用,承载量最大是100%。α(t)T为指示函数,δ为适应率,t为时间戳,b为偏移量参数。S表示曲线有S个变点。γ表示changepoint处的调整量。
k表示增长率:在现实的时间序列中,曲线的走势肯定不会一直保持不变,在某些特定的时候或者有着某种潜在的周期曲线会发生变化,模型定义了增长率k发生变化时对应的点,将其称作changepoints。一般情况下,模型会自动识别变点位置。如果一开始的增长率使用k代替的话,那么在时间戳t上的增长率就是
k+α(t)Tδ
还要考虑一个因素,即随着被监测对象在平台中运行时间的增长,被监测对象会随着业务的不断深入和积累发生累积性的变化,比如数据库表中记录条数的增长、对象存储中对象个数的增加,以及中间件配置信息的调优等,从而导致历史事件在预期未来的过程中所占比重随时间变化,越久远的历史事件影响程度越小,越临近当前的历史事件对未来的参考意义越大。因此,本发明优化了分段逻辑回归函数,在承载量的基础上增加了冷却参数。冷却参数的设置引入了“牛顿冷却定律的时间衰减函数模型”。该模型通过建立一个时间衰减函数,可以推导历史事件对当前事件的影响程度,得到如下公式:
Figure BDA0003491622030000071
该公式表明了t0时刻发生的事件在t时刻的衰减程度,q是设定的时间衰减系数,该系数在模型使用过程中不断调整和优化;经过t时间后,t0事件对当前影响由事件对当时的影响和衰减速率的乘积。
考虑了事件影响随时间衰减的影响后,分段逻辑回归函数如下所示:
Figure BDA0003491622030000072
(2)周期性即季节性趋势
季节性趋势采用傅里叶级数来近似表达,周期趋势以天为周期;
s(t)=X(t)β
Figure BDA0003491622030000073
β=(a1,b1,…,aN,bN)t
其中,P表示时间序列的周期,P=365.25表示以年为周期,P=7表示以周为周期。N表示希望在模型中使用的这种周期的个数,较大的N值可以拟合出更复杂的季节性函数。β的初始化是β~Normal(0,σ2),X(t)、β为傅里叶级数的分向量,σ是通过模型中seasonality_prior_scale来控制的。σ为季节效应控制变量,σ值越大,表示季节的效应越明显;σ值越小,表示季节的效应越不明显。aN和bN均为傅里叶级数中的两个参数向量。
(3)节假日项
节假日效应要充分考虑春运、暑运、小长假等提前订票的因素。
将当前时刻、被监测对象在k8s平台中pod的CPU占用率、内存占用率和pod个数作为趋势预测Prophet算法的输入参数,经计算获得该对象未来300秒的CPU占用率和内存占用率。
步骤104:根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
步骤104,具体包括:判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果;若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整;若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果;若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整;若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
在实际应用中,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
本发明还提供一种根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整在实际应用中的更为具体的调整方法。对于CPU或者内存占用率,以及最小阈值和最大阈值有如下判断策略(以CPU占用率举例),CPU或者内存占用率任何一个满足扩容或缩容条件,都会触发平台扩缩容操作:
1、当预测的CPU占用率大于弹性扩展最小阈值并小于弹性扩展最大阈值,不对pod容器做出弹性调整。
2、当预测的CPU占用率大于弹性扩展最大阈值时,立即对pod容器做出扩展调整,通过调用k8sAPI接口执行。
3、当预测的CPU占用率大于弹性收缩最小阈值并小于弹性收缩最大阈值时,不对pod容器做出弹性调整。
4、当预测的CPU占用率小于弹性收缩最小阈值时,立即对Pod做出收缩调整,通过调用k8sAPI接口执行。
5、当预测的CPU占用率大于弹性收缩最大阈值并小于弹性扩展最小阈值,不予调整。
通过获取被监测对象的CPU和内存占用率并不断积累历史数据,运用人工智能算法计算出当前阶段被监测对象最佳弹性方案,并通知k8s平台上基于事件驱动的架构组件,对被监测对象执行弹性伸缩,使得在满足业务压力的情况下最优化集群资源消耗,避免过度伸缩造成对象冷启动对服务响应的延迟。
如图2所示,本发明提供的一种基于CPU和内存占用率的智能弹性伸缩系统,包括:
配置模块201,用于对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置。
获取模块202,用于获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率。
预测模块203,用于根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据。
调整模块204,用于根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
在实际应用中,所述预测模块203,具体包括:预测单元,用于根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
在实际应用中,所述调整模块204,具体包括:
第一判断单元,用于判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果。
收缩调整单元,用于若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整。
第二判断单元,用于若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果。
扩展调整单元,用于若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整。
保持单元,用于若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
在实际应用中,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
本发明采用智能化算法从历史数据中挖掘变化规律,给出未来一段时间内对K8s平台中容器访问量的预测值,并且该预测充分考虑到历史事件对当前事件影响程度随时间变化的衰减,能够在大流量到来之前提前进行扩容从而平滑应对流量的激增;同时也能够在流量缩减的情况下根据预测值断定未来一段时间流量不会反复,果断地进行缩容,节省了平台资源。在流量到来之前提前准备好必要的pod容器,缓解了压力,使得服务响应时间不会发生不必要的变化,提升了客户感受的效果。即对未来一段时间流量是否在回落后再次提升做出预判,对于不会在短时间内激增的场景,可以直接缩容,尽最大程度释放并节省了平台资源。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种基于CPU和内存占用率的智能弹性伸缩方法,其特征在于,包括:
对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;
获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率;
根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据;
根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
2.根据权利要求1所述的基于CPU和内存占用率的智能弹性伸缩方法,其特征在于,所述根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据,具体包括:
根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
3.根据权利要求1所述的基于CPU和内存占用率的智能弹性伸缩方法,其特征在于,所述根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整,具体包括:
判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果;
若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整;
若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果;
若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整;
若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
4.根据权利要求3所述的基于CPU和内存占用率的智能弹性伸缩方法,其特征在于,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
5.一种基于CPU和内存占用率的智能弹性伸缩系统,其特征在于,包括:
配置模块,用于对平台的弹性扩展最大阈值和弹性收缩最小阈值进行配置;
获取模块,用于获取被监控对象的指标数据;所述被监控对象为平台的服务组件;所述指标数据包括CPU占用率和内存占用率;
预测模块,用于根据所述被监控对象的指标数据进行预测,得到设定时间的指标数据;
调整模块,用于根据所述设定时间的指标数据、所述弹性扩展最大阈值和所述弹性收缩最小阈值对平台进行调整。
6.根据权利要求5所述的基于CPU和内存占用率的智能弹性伸缩系统,其特征在于,所述预测模块,具体包括:
预测单元,用于根据所述被监控对象的指标数据利用时间序列预测算法进行预测,得到设定时间的指标数据。
7.根据权利要求5所述的基于CPU和内存占用率的智能弹性伸缩系统,其特征在于,所述调整模块,具体包括:
第一判断单元,用于判断所述设定时间的指标数据是否小于所述弹性收缩最小阈值,得到第一判断结果;
收缩调整单元,用于若所述第一判断结果表示为是,则对所述平台的Pod容器进行收缩调整;
第二判断单元,用于若所述第一判断结果表示为否,则判断所述设定时间的指标数据是否大于所述弹性扩展最大阈值,得到第二判断结果;
扩展调整单元,用于若所述第二判断结果表示为是,则对所述平台的Pod容器进行扩展调整;
保持单元,用于若所述第二判断结果表示为否,则保持所述平台的Pod容器的当前状态。
8.根据权利要求7所述的基于CPU和内存占用率的智能弹性伸缩系统,其特征在于,所述平台的Pod容器的收缩调整和扩展调整均通过调用平台的API接口执行。
CN202210097733.6A 2022-01-27 2022-01-27 一种基于cpu和内存占用率的智能弹性伸缩方法及系统 Pending CN114428666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210097733.6A CN114428666A (zh) 2022-01-27 2022-01-27 一种基于cpu和内存占用率的智能弹性伸缩方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210097733.6A CN114428666A (zh) 2022-01-27 2022-01-27 一种基于cpu和内存占用率的智能弹性伸缩方法及系统

Publications (1)

Publication Number Publication Date
CN114428666A true CN114428666A (zh) 2022-05-03

Family

ID=81313184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210097733.6A Pending CN114428666A (zh) 2022-01-27 2022-01-27 一种基于cpu和内存占用率的智能弹性伸缩方法及系统

Country Status (1)

Country Link
CN (1) CN114428666A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026550A (zh) * 2019-11-29 2020-04-17 中国科学院深圳先进技术研究院 容器云环境下的任务调度方法、装置、服务器及存储装置
CN112199150A (zh) * 2020-08-13 2021-01-08 北京航空航天大学 一种基于微服务调用依赖感知的在线应用动态扩缩容方法
CN113010260A (zh) * 2020-09-29 2021-06-22 证通股份有限公司 容器数量弹性伸缩方法以及容器数量弹性伸缩方法系统
CN113391883A (zh) * 2021-08-18 2021-09-14 中关村科学城城市大脑股份有限公司 应用于城市大脑的ai模型推理系统及方法
CN113946569A (zh) * 2021-08-26 2022-01-18 武汉氪细胞网络技术有限公司 一种用户画像构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026550A (zh) * 2019-11-29 2020-04-17 中国科学院深圳先进技术研究院 容器云环境下的任务调度方法、装置、服务器及存储装置
CN112199150A (zh) * 2020-08-13 2021-01-08 北京航空航天大学 一种基于微服务调用依赖感知的在线应用动态扩缩容方法
CN113010260A (zh) * 2020-09-29 2021-06-22 证通股份有限公司 容器数量弹性伸缩方法以及容器数量弹性伸缩方法系统
CN113391883A (zh) * 2021-08-18 2021-09-14 中关村科学城城市大脑股份有限公司 应用于城市大脑的ai模型推理系统及方法
CN113946569A (zh) * 2021-08-26 2022-01-18 武汉氪细胞网络技术有限公司 一种用户画像构建方法

Similar Documents

Publication Publication Date Title
CN109495318B (zh) 一种移动通信网络流量预测方法、装置及可读存储介质
US9076156B2 (en) Real-time adaptive binning through partition modification
CN106383766B (zh) 系统监控方法和装置
CN110378522A (zh) 预测配送状态信息的方法、装置、存储介质及电子设备
CN110289994B (zh) 一种集群容量调整方法及装置
CN117010571A (zh) 一种业务量的预测方法、装置及设备
CN113141410B (zh) 动态调节的qps控制方法、系统、设备及存储介质
CN110659922B (zh) 一种客户筛选方法、装置、服务器及计算机可读存储介质
CN115080619A (zh) 数据异常阈值确定方法及装置
CN103248622B (zh) 一种自动伸缩的在线视频服务质量保障方法及系统
CN115514020A (zh) 跨区域电力调度方法、装置、计算机设备和存储介质
CN114428666A (zh) 一种基于cpu和内存占用率的智能弹性伸缩方法及系统
CN102779058A (zh) 界面数据加载装置和界面数据加载方法
CN117097646A (zh) 尾延迟调整方法及装置
CN117076195A (zh) 参数的调整方法、装置、存储介质及电子装置
CN111832923A (zh) 一种基于出行需求预测的公共交通运力动态优化调度方法
CN109194759A (zh) 一种在前端降级的网络访问方法及系统
CN114139871B (zh) 日前发电备用容量配置方法、装置、存储介质及终端设备
CN111738582B (zh) 基于群落化的银行网点任务动态分配方法、装置和设备
CN116074774A (zh) 网元步长值调节方法及装置、设备、存储介质
CN112162827A (zh) 一种云平台容器降配方法、装置、系统及存储介质
CN112035324A (zh) 批量作业执行情况监控方法及装置
CN113837782A (zh) 时间序列模型的周期项参数优化方法、装置、计算机设备
Çil et al. Structural results on a batch acceptance problem for capacitated queues
CN106899515B (zh) 监控业务的选取方法及装置、业务监控系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination