CN113157537A - 一种基于ai算法基础的信息系统资源容量预测方法 - Google Patents
一种基于ai算法基础的信息系统资源容量预测方法 Download PDFInfo
- Publication number
- CN113157537A CN113157537A CN202011273072.5A CN202011273072A CN113157537A CN 113157537 A CN113157537 A CN 113157537A CN 202011273072 A CN202011273072 A CN 202011273072A CN 113157537 A CN113157537 A CN 113157537A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- information system
- system resource
- based information
- exponential smoothing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000012417 linear regression Methods 0.000 claims abstract description 11
- 238000010801 machine learning Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 230000000007 visual effect Effects 0.000 claims abstract description 6
- 238000009499 grossing Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000000737 periodic effect Effects 0.000 claims description 4
- 230000001932 seasonal effect Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 5
- 238000007726 management method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241001637516 Polygonia c-album Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于AI算法基础的信息系统资源容量预测方法,包括以下步骤:步骤1、根据需要场景提取样本数据并形成数据库;步骤2、通过tensorflow机器学习框架、tsfresh时序数据特征库、scikit‑learn算法库等计算框架提供AI算法基础;步骤3、采用Holt‑winters时序计算模型和线性回归+高斯核算法进行机器学习训练到预测结果;步骤4、将预测值与实际值进行对比并进行可视化展示,系统直接预测出较为准确的结果,可以作为参考,而且资源有效利用,规划周期短,管理方便,效果理想,预测结果可以有效指导客户。
Description
技术领域
本发明涉及容量预测领域,具体为一种基于AI算法基础的信息系统资源容量预测方法。
背景技术
容量预测是通过对历史以数据的分析、模型训练,预测未来时间段的容量趋势,容量预测价值是根据资源的历史状况自动预测其未来走势,帮助客户提前做好规划,主要提供如下价值:提高运维效率与预测精度,减少人力成本、实现最佳投资回报比;从被动扩容到主动预判,实现容量需求趋势感知、做到资源预警与提前采购;大幅缩短资源规划周期,提高资源规划效率;精细化、可视化的资源容量管理,更加的准确直观。
提前预知未来资源的使用情况,容量预测现状和痛点如下:
传统基于AI算法基础的信息系统资源容量预测方法:(1)经验法:按照现有容量的20倍设计、3倍实现、1.5倍部署;(2)新业务上线计划法:梳理最近一季度、半年要上线的新业务的预期业务量进行统计。现状痛点:(1)专家依赖性强;(2)资源浪费严重;(3)规划周期长;(4)粗放式管理。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种周期短、效果好,能对客户提供决策支撑的基于AI算法基础的信息系统资源容量预测方法。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:本发明的一种基于AI算法基础的信息系统资源容量预测方法,包括以下步骤:
步骤1、根据需要场景提取样本数据并形成数据库;
步骤2、通过tensorflow机器学习框架、tsfresh时序数据特征库、scikit-learn算法库等计算框架提供AI算法基础;
步骤3、采用Holt-winters时序计算模型和线性回归+高斯核算法进行机器学习训练到预测结果;
步骤4、将预测值与实际值进行对比并进行可视化展示。
本发明改进有,所述步骤1中的数据库包含基于IMOC的ES指标库中云平台的历史数据数据。
本发明改进有,所述Holt-winters时序计算模型包括以下步骤:
步骤1、一次指数平滑
预测公式:Y′t+1=α·Yt+(1-α)·Y′t
展开式:
步骤2、二次指数平滑,二次指数平滑是对一次指数平滑的再平滑
步骤3、三次指数平滑,三次就是在此基础上增加了一个季节分量,
递推公式:Si=α(xi-pi-k)+(1-α)(Si-1+ti-1)
ti=β(Si-Si-1)+(1-β)ti-1
pi=Y(xi-Si)+(1-Y)pi-k
pi是“周期性”部分
预测公式:xi+h=si+hti+pi-k+h
k是这个周期的周长
本发明改进有,所述线性回归算法包括以下步骤:
输入数据:矩阵X;回归系数:向量w;
本发明改进有,所述高斯加权算法为:
在估计中引入一些偏差,降低预测均方误差;
给待预测点附近的每个点一定的权重;
W即为权重矩阵,使用高斯核来确定每个权重;
(三)有益效果
与现有技术相比,本发明提供了一种基于AI算法基础的信息系统资源容量预测方法,具备以下有益效果:
通过tensorflow机器学习框架、tsfresh时序数据特征库、scikit-learn算法库等计算框架提供AI算法基础,采用Holt-winters时序计算模型和线性回归+高斯核算法进行机器学习训练等等得到预测结果,系统直接预测出较为准确的结果,可以作为参考,而且资源有效利用,规划周期短,管理方便,效果理想,预测结果可以有效指导客户。
附图说明
图1为本发明的第一次指数平滑示意图;
图2为本发明的第二次指数平滑示意图;
图3为本发明的现行回归算法示意图;
图4为本发明的高斯加权算法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照附图1至附图4,一种基于AI算法基础的信息系统资源容量预测方法,包括以下步骤:
步骤1、根据需要场景提取样本数据并形成数据库;
步骤2、通过tensorflow机器学习框架、tsfresh时序数据特征库、scikit-learn算法库等计算框架提供AI算法基础;
步骤3、采用Holt-winters时序计算模型和线性回归+高斯核算法进行机器学习训练到预测结果;
步骤4、将预测值与实际值进行对比并进行可视化展示。
本实施例中,所述步骤1中的数据库包含基于IMOC的ES指标库中云平台的历史数据数据。
算法原理如下:
1、容量预测相关算法
容量预测根据场景的不同,采用的算法也不相同,对于CPU、内存资源使用的场景,其使用量随时间周期性波动变化,使用holt-winters指数平滑算法,对于存储资源使用场景,其使用量随时间成递增趋势,使用线性回归和高斯核加权的算法
Holt-Winters指数平滑法:在移动平均法基础上发展起来的一种时间序列分析预测法。原理:任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。
(1)加强了观察期近期观察值对预测值的作用。
(2)对于观察值所赋予的权数有伸缩性。
步骤1、一次指数平滑
预测公式:Y′t+1=α·Yt+(1+α)·Y′t
展开式:
步骤2、参照附图1,二次指数平滑
二次指数平滑是对一次指数平滑的再平滑。
步骤3、参照附图2,三次指数平滑
三次就是在此基础上增加了一个季节分量。类似于趋势分量,对季节分量也要做指数平滑。
递推公式:Si=α(xi-pi-k)+(1-α)(Si-1+ti-1)
ti=β(Si-Si-1)+(1-β)ti-1
pi=Y(xi-Si)+(1-Y)pi-k
pi是指“周期性”部分。
预测公式:xi+h=si+hti+pi-k+h
k是这个周期的周长。
线性回归算法体现容量增长的趋势,高斯加权体现增长过程的波动性。
线性回归算法步骤如下,参照附图3:
输入数据:矩阵X;回归系数:向量w;
当有一些x和对应的γ,找到最佳的w的步骤如下:
之后再用高斯加权方法进行优化,参照附图4:可能出现欠拟合现象,因为求的是具有最小均方误差的无偏估计,本实施例改进有,在估计中引入一些偏差,降低预测均方误差,给待预测点附近的每个点一定的权重
W即为权重矩阵,使用高斯核来确定每个权重:
本方法在使用时的关键技术在于:
a.IMOC平台数据底座,为AI框架提供训练所需的样本数据,主要包括配置数据、指标数据、专题数据等等。
b.通过AI框架的特征框架,将样本数据处理为可供机器学习算法训练的数据,主要特征提取框架包括Tsfresh时序挖掘框架,ARIMA时序特征提取框架。
c.通过本方法中包括的AI算法对各个场景下的容量预测算法进行训练,并将训练结果,保存在数据底座的结果数据库中,主要的AI算法模型包括:Holt-winters时序计算模型,线性回归+高斯核函数模型。
d.对训练模型和结果数据进行算法评估,算法对比样本数据中实际数据和算法获取的预测数据评估算法是否正确。
e.通过算法选择或参数调优的方式进行算法优化,迭代多次对新模型进行训练,直至模型评估满足要求。
f.将算法优化后最终得到的算法模型进行对应场景的容量预测,得到预测数据指导容量规划。
前端容量预测服务和可视化大屏调用后台的数据做可视化展现。
可以通过该方法,设计出一套使用该方法的系统,包括预测任务的创建、编辑、查看和删除等等功能,通过容量预测场景的选择、对象类型选择、对象名称选择、起始结束时间选择、数据获取方式选择、定时任务方式选择等等设置,通过这些设置,获取容量预测所需的历史数据,确认历史数据是否满足容量预测场景、展示历史值的数据曲线、训练结果的数据曲线、计算模型匹配度、模型匹配等级,模型数据的最大值和最小值等等参数,并最终计算出预测结果,包括总容量、使用容量的历史值和预测值。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种基于AI算法基础的信息系统资源容量预测方法,其特征在于,包括以下步骤:
步骤1、根据需要场景提取样本数据并形成数据库;
步骤2、通过tensorflow机器学习框架、tsfresh时序数据特征库、scikit-learn算法库等计算框架提供AI算法基础;
步骤3、采用Holt-winters时序计算模型和线性回归+高斯核算法进行机器学习训练到预测结果;
步骤4、将预测值与实际值进行对比并进行可视化展示。
2.根据权利要求1所述的基于AI算法基础的信息系统资源容量预测方法,其特征在于,所述步骤1中的数据库包含基于IMOC的ES指标库中云平台的历史数据数据。
3.根据权利要求1所述的基于AI算法基础的信息系统资源容量预测方法,其特征在于,所述Holt-winters时序计算模型包括以下步骤:
步骤1、一次指数平滑
预测公式:Y′t+1=α·Yt+(1-α)·Y′t
展开式:
步骤2、二次指数平滑,二次指数平滑是对一次指数平滑的再平滑
步骤3、三次指数平滑,三次就是在此基础上增加了一个季节分量,
递推公式:Sj=α(xi-pi-k)+(1-α)(Sj-1+tj-1)
ti=β(Si-Si-1)+(1-β)ti-1
pi=Y(xj-Si)+(1-γ)pi-k
pj是“周期性”部分
预测公式:xi+h=si+hti+pj-k+h
k是这个周期的周长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011273072.5A CN113157537A (zh) | 2020-11-13 | 2020-11-13 | 一种基于ai算法基础的信息系统资源容量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011273072.5A CN113157537A (zh) | 2020-11-13 | 2020-11-13 | 一种基于ai算法基础的信息系统资源容量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113157537A true CN113157537A (zh) | 2021-07-23 |
Family
ID=76882320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011273072.5A Pending CN113157537A (zh) | 2020-11-13 | 2020-11-13 | 一种基于ai算法基础的信息系统资源容量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113157537A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110302301A1 (en) * | 2008-10-31 | 2011-12-08 | Hsbc Holdings Plc | Capacity control |
CN107222892A (zh) * | 2017-07-10 | 2017-09-29 | 东南大学 | 基于局部加权线性回归的超密集网络负载均衡优化方法 |
CN107358317A (zh) * | 2017-06-28 | 2017-11-17 | 北京优特捷信息技术有限公司 | 通过机器学习进行时序预测的方法及装置 |
US20180324199A1 (en) * | 2017-05-05 | 2018-11-08 | Servicenow, Inc. | Systems and methods for anomaly detection |
CN109034505A (zh) * | 2018-09-14 | 2018-12-18 | 国网河北省电力有限公司电力科学研究院 | 计量用表需求量在线预测方法及终端设备 |
CN110705780A (zh) * | 2019-09-27 | 2020-01-17 | 科大国创软件股份有限公司 | 一种基于智能算法的it性能指标预测方法 |
-
2020
- 2020-11-13 CN CN202011273072.5A patent/CN113157537A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110302301A1 (en) * | 2008-10-31 | 2011-12-08 | Hsbc Holdings Plc | Capacity control |
US20180324199A1 (en) * | 2017-05-05 | 2018-11-08 | Servicenow, Inc. | Systems and methods for anomaly detection |
CN107358317A (zh) * | 2017-06-28 | 2017-11-17 | 北京优特捷信息技术有限公司 | 通过机器学习进行时序预测的方法及装置 |
CN107222892A (zh) * | 2017-07-10 | 2017-09-29 | 东南大学 | 基于局部加权线性回归的超密集网络负载均衡优化方法 |
CN109034505A (zh) * | 2018-09-14 | 2018-12-18 | 国网河北省电力有限公司电力科学研究院 | 计量用表需求量在线预测方法及终端设备 |
CN110705780A (zh) * | 2019-09-27 | 2020-01-17 | 科大国创软件股份有限公司 | 一种基于智能算法的it性能指标预测方法 |
Non-Patent Citations (1)
Title |
---|
吴奇;严洪森;王斌;: "基于鲁棒小波ν-支持向量机的产品销售预测模型", 自动化学报, no. 07, pages 189 - 194 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108364085B (zh) | 一种外卖配送时间预测方法和装置 | |
CN109587713B (zh) | 一种基于arima模型的网络指标预测方法、装置及存储介质 | |
US20060100969A1 (en) | Learning-based method for estimating cost and statistics of complex operators in continuous queries | |
JP2019087030A (ja) | 予測モデル生成装置、予測モデル生成方法及び予測モデル生成プログラム | |
CN113268641B (zh) | 基于大数据的用户数据处理方法及大数据服务器 | |
US20070233532A1 (en) | Business process analysis apparatus | |
CN114358445A (zh) | 一种业务流程剩余时间预测模型推荐方法及系统 | |
CN113191533A (zh) | 仓库用工预测方法、装置、设备及存储介质 | |
CN113610225A (zh) | 质量评估模型训练方法、装置、电子设备及存储介质 | |
CN117632905B (zh) | 基于云端使用记录的数据库管理方法及系统 | |
CN109816157A (zh) | 项目计划优化方法、装置、计算机设备和存储介质 | |
CN117056591B (zh) | 基于动态预测的电力缴费渠道智能推荐方法及系统 | |
CN112925723A (zh) | 测试服务推荐方法、装置、计算机设备及存储介质 | |
CN112669073A (zh) | 一种用户留存预测方法、装置、电子设备及存储介质 | |
CN111080037A (zh) | 一种基于深度神经网络的短期电力负荷预测方法及装置 | |
CN113157537A (zh) | 一种基于ai算法基础的信息系统资源容量预测方法 | |
CN117827593A (zh) | 一种基于异常识别结果确定异常原因的方法和系统 | |
CN115169705A (zh) | 配送时长预测方法、装置、存储介质及计算机设备 | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
CN115204501A (zh) | 企业评估方法、装置、计算机设备和存储介质 | |
CN113095963A (zh) | 房地产成本数据处理方法、装置、计算机设备和存储介质 | |
CN113837782A (zh) | 时间序列模型的周期项参数优化方法、装置、计算机设备 | |
AU2020201689A1 (en) | Cognitive forecasting | |
JP2001175735A (ja) | 時系列予測装置及びシステム及び方法及び記憶媒体 | |
CN116843203B (zh) | 服务接入处理方法、装置、设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210723 |