CN114860542A - 趋势预测模型的优化方法、优化装置、电子设备和介质 - Google Patents

趋势预测模型的优化方法、优化装置、电子设备和介质 Download PDF

Info

Publication number
CN114860542A
CN114860542A CN202210470725.1A CN202210470725A CN114860542A CN 114860542 A CN114860542 A CN 114860542A CN 202210470725 A CN202210470725 A CN 202210470725A CN 114860542 A CN114860542 A CN 114860542A
Authority
CN
China
Prior art keywords
data
trend prediction
continuous
prediction model
trend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210470725.1A
Other languages
English (en)
Inventor
薛龙
谢晓军
陈长怡
周奇
张会炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210470725.1A priority Critical patent/CN114860542A/zh
Publication of CN114860542A publication Critical patent/CN114860542A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种云计算系统性能指标趋势预测模型的优化方法、装置、电子设备和介质,涉及人工智能技术领域。其中,云计算系统性能指标趋势预测模型的优化方法包括:将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;获取所述趋势预测模型输出的趋势预测数据;检测到所述趋势预测数据的第一准确率小于准确率阈值,基于所述性能监控数据更新模型训练样本库;将更新后的所述训练样本库中的数据输入所述趋势预测模型的训练模型,以基于训练结果得到优化后的所述趋势预测模型。通过本公开的技术方案,能够通过模型自反馈进行模型的自优化,进而能够使优化后的趋势预测模型输出准确率更高的趋势预测结果。

Description

趋势预测模型的优化方法、优化装置、电子设备和介质
技术领域
本公开涉及人工智能技术领域,尤其涉及一种云计算系统性能指标趋势预测模型的优化方法、云计算系统性能指标趋势预测模型的优化装置、电子设备和存储介质。
背景技术
随着人工智能算法的快速发展,其应用的计算场景也越来越多,对智能指标进行预测就是经典应用场景之一,是通过训练出预测模型预测出特定性能指标的变化趋势,比如网络安全等,以便于运维人员基于该变化趋势提前部署应对措施,但是目前预测模型得到的预测结果仍难以达到所要求的准确率,导致影响了实际中应用的可靠性。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种云计算系统性能指标趋势预测模型的优化方法、云计算系统性能指标趋势预测模型的优化装置、电子设备和存储介质,至少在一定程度上克服相关技术中目前预测模型得到的预测结果仍难以达到所要求的准确率的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种云计算系统性能指标趋势预测模型的优化方法,包括:将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;获取所述趋势预测模型输出的趋势预测数据;检测到所述趋势预测数据的第一准确率小于准确率阈值,基于所述性能监控数据更新模型训练样本库;将更新后的所述训练样本库中的数据输入所述趋势预测模型的训练模型,以基于训练结果得到优化后的所述趋势预测模型。
在一个实施例中,所述在检测到所述趋势预测数据的第一准确率小于准确率阈值之前,还包括:检测所述指定时段内所述性能指标的实际趋势数据;基于所述趋势预测数据与所述实际趋势数据之间的对比结果,得到所述第一准确率;所述基于所述性能监控数据更新模型训练样本库包括:基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据;将所述时序连续有效数据添加至所述模型训练样本库,以更新所述模型训练样本库。
在一个实施例中,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:统计所述全部性能监控数据的平均变化率;基于监控时间连续性将所述指定时段配置为至少一个子时段;在所述子时段内,将区间变化率大于所述平均变化率确定为所述连续数据筛选条件,以筛选满足所述连续数据筛选条件的连续数据区间;将所述连续数据区间内的所述性能监控数据确定为筛选出的所述时序连续有效数据。
在一个实施例中,所述在基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:基于不同的变化趋势获取多段连续验证数据,所述多段连续验证数据包括第一波动段,第二波动段、持续上传段、和持续下降段,所述第一波动段为整体呈上升趋势的波动段,所述第二波动段为整体呈下降趋势的波动段;分别基于所述多段连续验证数据更新所述训练样本库,以得到多个验证样本库;分别采用所述多个验证样本库对所述趋势预测模型进行验证训练,以得到验证训练结果;将具有最优的所述验证训练结果对应的所述变化趋势确定为所述连续数据筛选条件,并记为目标变化趋势;所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:从所述全部性能监控数据中筛选具有所述目标变化趋势的连续数据区间;将所述连续数据区间内的所述性能监控数据确定为所述时序连续有效数据。
在一个实施例中,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:基于预设时长和预设数量执行对所述全部性能监控数据的随机连续数据区间筛选,得到所述预设数量的随机连续样本区间;将所述随机连续样本区间内的所述性能监控数据确定为所述时序连续有效数据。
在一个实施例中,所述在基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:获取所述性能监控数据的历史干扰数据;对所述历史干扰数据的干扰性进行聚类操作,得到干扰特征;所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:检测到所述全部性能监控数据中的具有所述干扰特征的干扰数据;从所述全部性能监控数据数删除具有所述干扰数据的前半连续数据区间或后半连续数据区间;将剩余连续数据区间内的所述性能监控数据确定为所述时序连续有效数据。
在一个实施例中,所述性能监控数据包括多项性能,所述多项性能包括稳定性能、处理效率、利用率、操作性能、安全性能、计算准确性能和维护性能中的至少一种,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:基于所述第一准确率确定单项准确率小于所述准确率阈值的待优化性能项;从所述全部性能监控数据中筛选出与所述待优化性能项的匹配的连续性能数据,作为所述时序连续有效数据。
在一个实施例中,还包括:将所述性能监控数据输入优化后的所述趋势预测模型,输出优化趋势预测数据;基于所述优化趋势预测数据确定对应的第二准确率;检测到所述第二准确率大于所述第一准确率,则基于再次采集到的所述性能监控数据继续更新所述训练样本库,并基于继续更新的所述训练样本库继续优化所述趋势预测模型,直至检测到所述更新后版本的准确率小于或等于所述更新前版本的准确率;检测到所述第二准确率小于或等于所述第一准确率,从更新后的所述模型训练样本库中删除所述时序连续有效数据,并对所述趋势预测模型执行回滚至上一模型版本的操作。
在一个实施例中,所述趋势预测数据准确率阈值检测到所述趋势预测数据的第一准确率小于准确率阈值,还包括:生成预警提示信息,所述预警提示信息用于提示模型用户对所述趋势预测模型进行辅助分析。
根据本公开的第二方面,提供一种云计算系统性能指标趋势预测模型的优化装置,包括:输入模块,用于将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;获取模块,用于获取所述趋势预测模型输出的趋势预测数据;更新模块,用于趋势预测数据准确率阈值检测到所述趋势预测数据的第一准确率小于准确率阈值,基于所述性能监控数据更新模型训练样本库;优化模块,用于将更新后的所述训练样本库中的数据输入所述趋势预测模型的训练模型,以基于训练结果得到优化后的所述趋势预测模型。
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;所述处理器配置为经由执行所述可执行指令来执行上述的云计算系统性能指标趋势预测模型的优化方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的云计算系统性能指标趋势预测模型的优化方法。
本公开的实施例所提供的云计算系统性能指标趋势预测模型的优化方法,在检测到趋势预测模型在优化之前的准确率小于准确率阈值时,可以理解为当前指定时段采集到的性能监控数据反映的系统工况未反映在目前的趋势预测模型中,通过基于指定时段内采集到的用于模型预测的性能监控数据,对原始的模型训练样本库进行更新,实现了利用模型分析结果作为评判依据,利用模型输入数据来丰富样本数据库,能够在趋势预测模型的线上应用过程中通过模型自反馈进行模型的自优化,进而能够使优化后的趋势预测模型输出准确率更高的趋势预测结果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开实施例中一种云计算系统性能指标趋势预测模型的优化方法流程图;
图2示出本公开实施例中另一种云计算系统性能指标趋势预测模型的优化方法流程图;
图3示出本公开实施例中另一种云计算系统性能指标趋势预测模型的优化方法流程图;
图4示出本公开实施例中再一种云计算系统性能指标趋势预测模型的优化方法流程图;
图5示出本公开实施例中又一种云计算系统性能指标趋势预测模型的优化方法流程图;
图6示出本公开实施例中又一种云计算系统性能指标趋势预测模型的优化方法流程图;
图7示出本公开实施例中又一种云计算系统性能指标趋势预测模型的优化方法流程图;
图8示出本公开实施例中又一种云计算系统性能指标趋势预测模型的优化方法流程图;
图9示出本公开实施例中一种云计算系统性能指标趋势预测模型的优化方案的架构示意图;
图10示出本公开实施例中又一种云计算系统性能指标趋势预测模型的优化方法流程图;
图11示出本公开实施例中一种云计算系统性能指标趋势预测模型的优化装置示意图;
图12示出本公开实施例中一种计算机设备的结构框图;和
图13示出本公开实施例中一种程序产品的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
基于云计算系统的智能化运维的经典应用场景智能指标预测,其目的是运用人工智能算法更好的预测出特定指标的趋势变化,以便运维人员可以更好的提前部署好应对的措施。但是目前在通过人工智能算法预测的结果很难达到客户要求的准确率,很大程度降低了智能预测结果的可靠性和用户依赖性。
由于指标预测的准确率高低主要与选取的算法模型、筛选出的样本数据有关。在现有开源算法模型基础上或者单独开发出新的高准确率算法模型,难度和成本过高。
因此,持续丰富样本数据是一种相对简单但十分有效地来提高指标预测准确率的思路,然而如何持续丰富样本数据最终达到高准确率就成为新的问题。一方面,从开发到交付整个过程,很难保证已获取到所有情况的样本数据。另一方面,对交付后的系统面临预测不准确时,没有闭环的反馈机制来反作用指标预测系统。
本申请提供的方案,通过基于指定时段内采集到的用于模型预测的性能监控数据,对原始的模型训练样本库进行更新,实现了利用模型分析结果作为评判依据,利用模型输入数据来丰富样本数据库,能够在趋势预测模型的线上应用过程中通过模型自反馈进行模型的自优化,进而能够使优化后的趋势预测模型输出准确率更高的趋势预测结果。
下面,将结合附图及实施例对本示例实施方式中的云计算系统性能指标趋势预测模型的优化方法的各个步骤进行更详细的说明。
图1示出本公开实施例中一种云计算系统性能指标趋势预测模型的优化方法流程图。
如图1所示,根据本公开的一个实施例的云计算系统性能指标趋势预测模型的优化方法,包括以下步骤:
步骤S102,将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型。
其中,指定时段可以理解为监控时段,可以采用自动设定校验时间段的方式实现,性能监控数据可以理解为在时序上的反映系统性能的持续监控得到的时间连续的监控数据,具体可以为系统运维数据,包括系统日志、监控信息和应用信息等。
另外,趋势预测模型用于性能指标的变化趋势进行预测,性能指标包括但不限于系统稳定性能指标、处理效率指标、资源利用率指标、操作性能指标、安全性能指标、计算准确性能指标和维护性能指标等。
步骤S104,获取趋势预测模型输出的趋势预测数据。
步骤S106,检测到趋势预测数据的第一准确率小于准确率阈值,基于性能监控数据更新模型训练样本库。
其中,第一准确率可以理解为趋势预测模型在优化之前的原始准确率。
准确率阈值可以理解为用户预期的趋势预测模型的预测准确率。
另外,基于性能监控数据更新模型训练样本库,可以为将部分或全部性能监控数据添加至模型训练样本库中,或基于性能监控数据对模型训练样本库进行优化。
步骤S108,将更新后的训练样本库中的数据输入趋势预测模型的训练模型,以基于训练结果得到优化后的趋势预测模型。
其中,模型训练的一种实现过程,包括:定义一个包含多个可学习参数(权重)的神经网络,对输入的样本数据进行迭代计算,通过多层网络结构来处理输入数据,计算损失值(输出值与目标值的差值),反向传播梯度到神经网络的参数中;根据更新规则来更新网络中的权重值。
在该实施例中,在检测到趋势预测模型在优化之前的准确率小于准确率阈值时,可以理解为当前指定时段采集到的性能监控数据反映的系统工况未反映在目前的趋势预测模型中,通过基于指定时段内采集到的用于模型预测的性能监控数据,对原始的模型训练样本库进行更新,实现了利用模型分析结果作为评判依据,利用模型输入数据来丰富样本数据库,能够在趋势预测模型的线上应用过程中通过模型自反馈进行模型的自优化,进而能够使优化后的趋势预测模型输出准确率更高的趋势预测结果。
如图2所示,根据本公开的另一个实施例的云计算系统性能指标趋势预测模型的优化方法,包括以下步骤:
步骤S202,将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型。
步骤S204,获取趋势预测模型输出的趋势预测数据。
步骤S206,检测指定时段内性能指标的实际趋势数据。
步骤S208,基于趋势预测数据与实际趋势数据之间的对比结果,得到第一准确率。
步骤S210,检测到趋势预测数据的第一准确率小于准确率阈值,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据。
其中,由于趋势预测与时间连续性强相关,因此连续数据筛选条件,可以理解为从采集到的全部性能监控数据中筛选出有利于模型训练的在时间上呈连续性的一组或多组数据。
步骤S212,将时序连续有效数据添加至模型训练样本库,以更新模型训练样本库。
步骤S214,将更新后的训练样本库中的数据输入趋势预测模型的训练模型,以基于训练结果得到优化后的趋势预测模型。
在该实施例中,通过获取性能指标的实际趋势数据,以基于趋势预测数据实际趋势数据之间的对比结果得到第一准确率,保证了第一准确率检测的可靠性,另外,通过设置连续数据筛选条件,以从采集到的全部性能监控数据中筛选出有利于模型训练的时序连续数据作为时序连续有效数据,不仅自动对智能预测结果准确率过低的情况进行反馈分析,更重要的是充分利用这些预测结果较差但是具有研究价值的数据,实现对训练样本数据库的完善补充,对预测准确率这一种要性能指标的提高起到了很大的作用,大大提高用户体验,以保证模型优化的有效性和可靠性。
如图3所示,在一个实施例中,步骤S210中,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据的第一种实现方式,包括:
步骤S302,统计全部性能监控数据的平均变化率。
步骤S304,基于监控时间连续性将指定时段配置为至少一个子时段。
其中,监控时间连续性配置指,若在指定时段内持续监测到性能监控数据,则可以只配置一个时段,以保证监控的连续性。
步骤S306,在子时段内,将区间变化率大于平均变化率确定为连续数据筛选条件,以筛选满足连续数据筛选条件的连续数据区间。
步骤S308,将连续数据区间内的性能监控数据确定为筛选出的时序连续有效数据。
作为一种较简单的子时段的确定方式,确定区间变化率大于平均变化率的目标连续数据段,目标连续数据段的起点对应于第一时刻,目标连续数据段的终点对应于第二时刻,确定第一时刻与指定时段的起始时刻之间的第一时长,以及指定时段的终止时刻与第二时刻之间的第二时长,若第一时长小于或等于第二时长,将起始时刻和第二时刻之间的第一连续数据段筛选为有效数据,若第一时长大于第二时长,将第一时刻和终止时刻之间的第二连续数据段筛选为有效数据。
具体地,首先获取从检测到本次预测初始准确率小于预设阈值的时刻起,倒取N个小时的全部性能监控数据,然后计算获取到的平均数据变化率,进一步进行数据分析,不断找出数据变化比较明显的部分,例如,选择8个小时的连续数据,前面6个小时的数据基本都保持在50这个值,后面两个小时的数据起伏较大,那么就可删除前面6个小时的数据,保留后面两个小时,这样通过重复上述步骤,实现时序连续有效数据的筛选。
本领域技术人员能够理解的是,但是有一个前提,必须保持数据在时间维度上的连续性的基础上删除部分无效数据,即一段连续数据只能删除头尾部分数据,因为删除中间部分,会造成数据断续,导致数据产生一种人工改造的属性,导致影响数据有效性。
在该实施例中,由于起伏较大的数据段相比于比较平稳的数据段更能够反映模型训练过程中未遇到过的工况趋势,因此通过将区间变化率大于平均变化率确定为连续数据筛选条件,以筛选满足对应的连续数据区间,得到时序连续有效数据,以保证基于上述时序连续有效数据更新后的样本数据库进行模型优化训练的训练有效性。
如图4所示,在一个实施例中,在基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:
步骤S402,基于不同的变化趋势获取多段连续验证数据,多段连续验证数据包括第一波动段,第二波动段、持续上传段、和持续下降段,第一波动段为整体呈上升趋势的波动段,第二波动段为整体呈下降趋势的波动段。
步骤S404,分别基于多段连续验证数据更新训练样本库,以得到多个验证样本库。
步骤S406,分别采用多个验证样本库对趋势预测模型进行验证训练,以得到验证训练结果。
步骤S408,将具有最优的验证训练结果对应的变化趋势确定为连续数据筛选条件,并记为目标变化趋势。
步骤S210中,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据的第二种实现方式,包括:
步骤S410,检测到趋势预测数据的第一准确率小于准确率阈值,从全部性能监控数据中筛选具有目标变化趋势的连续数据区间。
步骤S412,将连续数据区间内的性能监控数据确定为时序连续有效数据。
在该实施例中,通过设置预验证阶段,以分别对持续上传段、和持续下降段,整体呈上升趋势的波动段以及整体呈下降趋势的波动段进行分别验证,以基于验证结果确定哪种趋势有益于模型的优化,从而在采集到性能监控数据时,筛选出该种趋势的连续数据区间作为时序连续有效数据,以进一步提升模型训练样本数据获取的有效性和可靠性,进而达到提升模型预测结果准确性的目的。
如图5所示,在一个实施例中,步骤S210中,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据的第三种实现方式,包括:
步骤S502,基于预设时长和预设数量执行对全部性能监控数据的随机连续数据区间筛选,得到预设数量的随机连续样本区间。
步骤S504,将随机连续样本区间内的性能监控数据确定为时序连续有效数据。
在该实施例中,为了减少筛选数据过程中人工参与程度,还可以通过在设置号连续样本区间的时长和区间数量后,采用随机筛选的方式得到时序连续有效数据,以实现预测模型的预测准确率的提升。
如图6所示,在一个实施例中,在基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:
步骤S602,获取性能监控数据的历史干扰数据。
步骤S604,对历史干扰数据的干扰性进行聚类操作,得到干扰特征。
其中,聚类指按照某个特定标准把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,不在同一个簇中的数据对象的差异性也尽可能地大,以得到具有相似性的干扰特征。
其中聚类方法具体可以采用K-Means聚类算法。
步骤S210中,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据的第四种实现方式,包括:
步骤S606,检测到趋势预测数据的第一准确率小于准确率阈值,检测到全部性能监控数据中的具有干扰特征的干扰数据。
步骤S608,从全部性能监控数据数删除具有干扰数据的前半连续数据区间或后半连续数据区间。
其中,删除前半连续数据区间还是后半连续数据区间,基于区间长度确定,若前半连续数据区间较短,则删除前半连续数据区间,若后半连续数据区间较短,则删除后半连续数据区间。
步骤S610,将剩余连续数据区间内的性能监控数据确定为时序连续有效数据。
在该实施例中,通过从全部性能监控数据中筛选处干扰数据,将剩余的具有时序连续性的性能监控数据确定为时序连续有效数据,以保证加入到样本数据库中的数据的可靠性。
如图7所示,在一个实施例中,性能监控数据包括多项性能,多项性能包括稳定性能、处理效率、利用率、操作性能、安全性能、计算准确性能和维护性能中的至少一种,步骤S210中,基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据的第五种实现方式,包括:
步骤S702,基于第一准确率确定单项准确率小于准确率阈值的待优化性能项。
步骤S704,从全部性能监控数据中筛选出与待优化性能项的匹配的连续性能数据,作为时序连续有效数据。
在该实施例中,通过对监控性能进行分类处理,在检测到综合性能指标预测的准确率小于准确率阈值时,进一步找出单项准确率小于准确率阈值的性能项,然后筛选出反映该性能项的性能监控数据作为时序连续有效数据,以通过提升单项性能指标的预测效果达到综合性能指标的预测效果的目的。
在一种具体应用场景中,AIOps(Artificial Intelligence for IT Operations,智能运维)指将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题,通过将云计算系统性能指标趋势预测模型的优化方案应用到AIOps项目的关键指标智能预测场景中,选取关键业务性能指标进行预测,并校验智能预测功能的准确率,同时不断持续完善提高关键指标的智能预测准确率,更好的为运维人员提供准确的预测值作为实施的依据。
如图8所示,在一个实施例中,还包括:
步骤S802,将性能监控数据输入优化后的趋势预测模型,输出优化趋势预测数据。
步骤S804,基于优化趋势预测数据确定对应的第二准确率。
步骤S806,检测到第二准确率大于第一准确率,则基于再次采集到的性能监控数据继续更新训练样本库,并基于继续更新的训练样本库继续优化趋势预测模型,直至检测到更新后版本的准确率小于或等于更新前版本的准确率。
步骤S808,检测到第二准确率小于或等于第一准确率,从更新后的模型训练样本库中删除时序连续有效数据,并对趋势预测模型执行回滚至上一模型版本的操作。
在该实施例中,通过本公开中的云计算系统性能指标趋势预测自反馈优化方案,可以自动校验设定的指定时间段内的趋势预测数据和实际趋势数据之间的误差趋势并得到相应的准确率,当指定时间段内准确率低于设定的准确率阈值时,将此时间段内原始数据进行筛选放入样本库中,重新训练模型,利用新的模型训练结果,对大量样本数据进行测试验证,通过统计,对比以前的相应数据,如果准确率效果改善,采用新的训练模型结果进行下一轮的智能预测,假如准确率效果不明显或者更差,则删除新加样本数据,滚回上一次的训练结果,从而达到对预测模型进行持续优化的效果。
在一个实施例中,趋势预测数据准确率阈值检测到趋势预测数据的第一准确率小于准确率阈值,还包括:生成预警提示信息,预警提示信息用于提示模型用户对趋势预测模型进行辅助分析。
在该实施例中,通过指定时间段内准确率低于设定的准确率阈值时,进行预警提醒,以便人工及时参与辅助分析,同时对智能预测模型数据样本库进行扩充,重新训练模型,测试预测效果,最终达到一个闭环的持续优化的效果。
如图9所示,根据本公开实施例的云计算系统性能指标趋势预测模型的优化方案,包括:云计算系统性能指标实时监控模块902、趋势预测模型904、趋势预测数据与实际趋势数据对比模块906、自反馈优化模块908和神经网络训练模块910。
其中,云计算系统性能指标实时监控模块902用于输出性能监控数据,并将性能监控数据输入到趋势预测模型904,得到性能指标趋势预测数据,结合实际检测到的性能指标实际趋势数据,通过趋势预测数据与实际趋势数据对比模块906进行对比得到对比结果,进而通过自反馈优化模块908得到第一准确率,并在检测到第一准确率小于准确率阈值时,得到性能指标历史监控数据,将性能指标历史监控数据输入到训练样本库,采用神经网络训练模块910进行优化训练,以实现对趋势预测模型的预测结果的优化。
如图10所示,根据本公开的又一个实施例的云计算系统性能指标趋势预测模型的优化方法,包括以下步骤:
步骤S1002,获取性能指标实时监控数据。
步骤S1004,对预测结果测试,性能指标预测趋势数据。
步骤S1006,获取性能指标实际趋势数据。
步骤S1008,趋势预测数据与实际趋势数据对比,基于对比结果确定准确率未达到预期。
步骤S1010,进行预测失误报警。
步骤S1012,从实时监控数据提取预测周期内性能指标的时序连续有效数据。
步骤S1014,生成云计算系统性能指标历史监控数据库。
步骤S1016,更新训练样本库。
其中,通过从云计算系统性能指标历史监控数据库中筛选时序连续有效数据得到新样本数据来更新训练样本库。
步骤S1018,采用神经网络训练模型进行模型训练。
其中,神经网络具体可以为LSTM(Long Short Term Memory,长短期记忆人工神经网络),通过LSTM进行模型训练,得到基于新训练结果的优化后的趋势预测模型。
步骤S1020,性能指标预测趋势数据的预测效果是否改善。
若“是”,则保留新样本数据和新训练结果,若“否”,则删除新样本数据和新训练结果。
在该实施例中,通过聚焦在通过将输出的云计算系统性能指标趋势预测结果自反馈给整个预测系统来持续优化提高云计算系统性能指标预测结果的准确率,根据智能预测理论知识和实验测试结果,以持续优化完善样本历史数据为切入口,增加样本数据的多样性和复杂性,可以有效的提高云计算系统性能指标趋势预测结果的准确率,从而形成一个闭环的自反馈优化系统,实现关键指标趋势预测结果准确率的标准持续优化效果。
需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下面参照图11来描述根据本发明的实施方式的云计算系统性能指标趋势预测模型的优化装置1100。图11所示的云计算系统性能指标趋势预测模型的优化装置1100仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
云计算系统性能指标趋势预测模型的优化装置1100以硬件模块的形式表现。云计算系统性能指标趋势预测模型的优化装置1100的组件可以包括但不限于:第一输入模块1102,用于将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;获取模块1104,用于获取趋势预测模型输出的趋势预测数据;更新模块1106,用于趋势预测数据准确率阈值检测到趋势预测数据的第一准确率小于准确率阈值,基于性能监控数据更新模型训练样本库;优化模块1108,用于将更新后的训练样本库中的数据输入趋势预测模型的训练模型,以基于训练结果得到优化后的趋势预测模型。
在一个实施例中,还包括:检测模块1110,用于检测指定时段内性能指标的实际趋势数据;基于趋势预测数据与实际趋势数据之间的对比结果,得到第一准确率;更新模块1106还用于:基于连续数据筛选条件,从指定时段采集到的全部性能监控数据中筛选出时序连续有效数据;将时序连续有效数据添加至模型训练样本库,以更新模型训练样本库。
在一个实施例中,更新模块1106还用于:统计全部性能监控数据的平均变化率;基于监控时间连续性将指定时段配置为至少一个子时段;在子时段内,将区间变化率大于平均变化率确定为连续数据筛选条件,以筛选满足连续数据筛选条件的连续数据区间;将连续数据区间内的性能监控数据确定为筛选出的时序连续有效数据。
在一个实施例中,包括:验证模块1112,用于基于不同的变化趋势获取多段连续验证数据,多段连续验证数据包括第一波动段,第二波动段、持续上传段、和持续下降段,第一波动段为整体呈上升趋势的波动段,第二波动段为整体呈下降趋势的波动段;分别基于多段连续验证数据更新训练样本库,以得到多个验证样本库;分别采用多个验证样本库对趋势预测模型进行验证训练,以得到验证训练结果;将具有最优的验证训练结果对应的变化趋势确定为连续数据筛选条件,并记为目标变化趋势;更新模块1106还用于:从全部性能监控数据中筛选具有目标变化趋势的连续数据区间;将连续数据区间内的性能监控数据确定为时序连续有效数据。
在一个实施例中,更新模块1106还用于:基于预设时长和预设数量执行对全部性能监控数据的随机连续数据区间筛选,得到预设数量的随机连续样本区间;将随机连续样本区间内的性能监控数据确定为时序连续有效数据。
在一个实施例中,还包括:干扰检测模块1114,用于获取性能监控数据的历史干扰数据;对历史干扰数据的干扰性进行聚类操作,得到干扰特征;更新模块1106还用于:检测到全部性能监控数据中的具有干扰特征的干扰数据;从全部性能监控数据数删除具有干扰数据的前半连续数据区间或后半连续数据区间;将剩余连续数据区间内的性能监控数据确定为时序连续有效数据。
在一个实施例中,性能监控数据包括多项性能,多项性能包括稳定性能、处理效率、利用率、操作性能、安全性能、计算准确性能和维护性能中的至少一种,更新模块1106还用于:基于第一准确率确定单项准确率小于准确率阈值的待优化性能项;从全部性能监控数据中筛选出与待优化性能项的匹配的连续性能数据,作为时序连续有效数据。
在一个实施例中,还包括:第二输入模块1116,用于将性能监控数据输入优化后的趋势预测模型,输出优化趋势预测数据;确定模块1118,用于基于优化趋势预测数据确定对应的第二准确率;更新模块1106还用于:检测到第二准确率大于第一准确率,则基于再次采集到的性能监控数据继续更新训练样本库,并基于继续更新的训练样本库继续优化趋势预测模型,直至检测到更新后版本的准确率小于或等于更新前版本的准确率;还包括:回滚模块1120,用于检测到第二准确率小于或等于第一准确率,从更新后的模型训练样本库中删除时序连续有效数据,并对趋势预测模型执行回滚至上一模型版本的操作。
在一个实施例中,还包括:预警模块1122,用于生成预警提示信息,预警提示信息用于提示模型用户对趋势预测模型进行辅助分析。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图12来描述根据本发明的这种实施方式的电子设备1200。图12显示的电子设备1200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图12所示,电子设备1200以通用计算设备的形式表现。电子设备1200的组件可以包括但不限于:上述至少一个处理单元1210、上述至少一个存储单元1220、连接不同系统组件(包括存储单元1220和处理单元1210)的总线1230。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1210执行,使得所述处理单元1210执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1210可以执行如图1中所示的步骤S102至步骤S108所描述的方案。
存储单元1220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)12201和/或高速缓存存储单元12202,还可以进一步包括只读存储单元(ROM)12203。
存储单元1220还可以包括具有一组(至少一个)程序模块12205的程序/实用工具12204,这样的程序模块12205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1200也可以与一个或多个外部设备1270(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1200交互的设备通信,和/或与使得该电子设备1200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1250进行。并且,电子设备1200还可以通过网络适配器1260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1260通过总线1230与电子设备1200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者电子设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图13所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品1300,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者电子设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (12)

1.一种云计算系统性能指标趋势预测模型的优化方法,其特征在于,包括:
将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;
获取所述趋势预测模型输出的趋势预测数据;
检测到所述趋势预测数据的第一准确率小于准确率阈值,基于所述性能监控数据更新模型训练样本库;
将更新后的所述训练样本库中的数据输入所述趋势预测模型的训练模型,以基于训练结果得到优化后的所述趋势预测模型。
2.根据权利要求1所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述在检测到所述趋势预测数据的第一准确率小于准确率阈值之前,还包括:
检测所述指定时段内所述性能指标的实际趋势数据;
基于所述趋势预测数据与所述实际趋势数据之间的对比结果,得到所述第一准确率;
所述基于所述性能监控数据更新模型训练样本库包括:
基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据;
将所述时序连续有效数据添加至所述模型训练样本库,以更新所述模型训练样本库。
3.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:
统计所述全部性能监控数据的平均变化率;
基于监控时间连续性将所述指定时段配置为至少一个子时段;
在所述子时段内,将区间变化率大于所述平均变化率确定为所述连续数据筛选条件,以筛选满足所述连续数据筛选条件的连续数据区间;
将所述连续数据区间内的所述性能监控数据确定为筛选出的所述时序连续有效数据。
4.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述在基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:
基于不同的变化趋势获取多段连续验证数据,所述多段连续验证数据包括第一波动段,第二波动段、持续上传段、和持续下降段,所述第一波动段为整体呈上升趋势的波动段,所述第二波动段为整体呈下降趋势的波动段;
分别基于所述多段连续验证数据更新所述训练样本库,以得到多个验证样本库;
分别采用所述多个验证样本库对所述趋势预测模型进行验证训练,以得到验证训练结果;
将具有最优的所述验证训练结果对应的所述变化趋势确定为所述连续数据筛选条件,并记为目标变化趋势;
所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:
从所述全部性能监控数据中筛选具有所述目标变化趋势的连续数据区间;
将所述连续数据区间内的所述性能监控数据确定为所述时序连续有效数据。
5.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:
基于预设时长和预设数量执行对所述全部性能监控数据的随机连续数据区间筛选,得到所述预设数量的随机连续样本区间;
将所述随机连续样本区间内的所述性能监控数据确定为所述时序连续有效数据。
6.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述在基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据之前,包括:
获取所述性能监控数据的历史干扰数据;
对所述历史干扰数据的干扰性进行聚类操作,得到干扰特征;
所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:
检测到所述全部性能监控数据中的具有所述干扰特征的干扰数据;
从所述全部性能监控数据数删除具有所述干扰数据的前半连续数据区间或后半连续数据区间;
将剩余连续数据区间内的所述性能监控数据确定为所述时序连续有效数据。
7.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述性能监控数据包括多项性能,所述多项性能包括稳定性能、处理效率、利用率、操作性能、安全性能、计算准确性能和维护性能中的至少一种,所述基于连续数据筛选条件,从所述指定时段采集到的全部性能监控数据中筛选出时序连续有效数据包括:
基于所述第一准确率确定单项准确率小于所述准确率阈值的待优化性能项;
从所述全部性能监控数据中筛选出与所述待优化性能项的匹配的连续性能数据,作为所述时序连续有效数据。
8.根据权利要求2所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,还包括:
将所述性能监控数据输入优化后的所述趋势预测模型,输出优化趋势预测数据;
基于所述优化趋势预测数据确定对应的第二准确率;
检测到所述第二准确率大于所述第一准确率,则基于再次采集到的所述性能监控数据继续更新所述训练样本库,并基于继续更新的所述训练样本库继续优化所述趋势预测模型,直至检测到所述更新后版本的准确率小于或等于所述更新前版本的准确率;
检测到所述第二准确率小于或等于所述第一准确率,从更新后的所述模型训练样本库中删除所述时序连续有效数据,并对所述趋势预测模型执行回滚至上一模型版本的操作。
9.根据权利要求1至8中任一项所述的云计算系统性能指标趋势预测模型的优化方法,其特征在于,所述趋势预测数据准确率阈值检测到所述趋势预测数据的第一准确率小于准确率阈值,还包括:
生成预警提示信息,所述预警提示信息用于提示模型用户对所述趋势预测模型进行辅助分析。
10.一种云计算系统性能指标趋势预测模型的优化装置,其特征在于,包括:
输入模块,用于将指定时段采集到的性能监控数据输入用于性能指标趋势预测的趋势预测模型;
获取模块,用于获取所述趋势预测模型输出的趋势预测数据;
更新模块,用于趋势预测数据准确率阈值检测到所述趋势预测数据的第一准确率小于准确率阈值,基于所述性能监控数据更新模型训练样本库;
优化模块,用于将更新后的所述训练样本库中的数据输入所述趋势预测模型的训练模型,以基于训练结果得到优化后的所述趋势预测模型。
11.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~9中任意一项所述云计算系统性能指标趋势预测模型的优化方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~9中任意一项所述的云计算系统性能指标趋势预测模型的优化方法。
CN202210470725.1A 2022-04-28 2022-04-28 趋势预测模型的优化方法、优化装置、电子设备和介质 Pending CN114860542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210470725.1A CN114860542A (zh) 2022-04-28 2022-04-28 趋势预测模型的优化方法、优化装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210470725.1A CN114860542A (zh) 2022-04-28 2022-04-28 趋势预测模型的优化方法、优化装置、电子设备和介质

Publications (1)

Publication Number Publication Date
CN114860542A true CN114860542A (zh) 2022-08-05

Family

ID=82634572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210470725.1A Pending CN114860542A (zh) 2022-04-28 2022-04-28 趋势预测模型的优化方法、优化装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN114860542A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117314269A (zh) * 2023-09-14 2023-12-29 博瀚智能(深圳)有限公司 质检模型管理方法、系统、电子设备及存储介质
WO2024098174A1 (en) * 2022-11-07 2024-05-16 Qualcomm Incorporated Model monitoring using input samples

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980922A (zh) * 2017-03-03 2017-07-25 国网天津市电力公司 一种基于大数据的输变电设备状态评价方法
WO2021051945A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 服务器性能监控方法、装置、计算机设备及存储介质
CN114266352A (zh) * 2021-12-16 2022-04-01 中国电信股份有限公司 模型训练结果优化方法、装置、存储介质及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980922A (zh) * 2017-03-03 2017-07-25 国网天津市电力公司 一种基于大数据的输变电设备状态评价方法
WO2021051945A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 服务器性能监控方法、装置、计算机设备及存储介质
CN114266352A (zh) * 2021-12-16 2022-04-01 中国电信股份有限公司 模型训练结果优化方法、装置、存储介质及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024098174A1 (en) * 2022-11-07 2024-05-16 Qualcomm Incorporated Model monitoring using input samples
CN117314269A (zh) * 2023-09-14 2023-12-29 博瀚智能(深圳)有限公司 质检模型管理方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110413227B (zh) 一种硬盘设备的剩余使用寿命在线预测方法和系统
US20180082215A1 (en) Information processing apparatus and information processing method
CN114860542A (zh) 趋势预测模型的优化方法、优化装置、电子设备和介质
CN109471698B (zh) 云环境下虚拟机异常行为检测系统和方法
KR102359090B1 (ko) 실시간 기업정보시스템 이상행위 탐지 서비스를 제공하는 방법과 시스템
KR20190139126A (ko) 소리 정보를 이용한 전력용 변압기의 이상 상황 탐지
Zhao et al. Probabilistic remaining useful life prediction based on deep convolutional neural network
CN115640159A (zh) 一种微服务故障诊断方法及系统
CN114490404A (zh) 一种测试用例确定方法、装置、电子设备及存储介质
WO2022009010A1 (en) Model fidelity monitoring and regeneration for manufacturing process decision support
CN115204536A (zh) 楼宇设备故障预测方法、装置、设备及存储介质
CN110490132B (zh) 数据处理方法和装置
CN109710523B (zh) 视觉稿的测试用例生成方法及装置、存储介质、电子设备
KR102352954B1 (ko) 예측 자동 회귀 기반 실시간 기업정보시스템 사용자 이상행위 탐지 시스템 및 방법
CN112783508B (zh) 文件的编译方法、装置、设备以及存储介质
CN113886821A (zh) 基于孪生网络的恶意进程识别方法、装置、电子设备及存储介质
CN112801315A (zh) 电力二次设备的状态诊断方法、装置及终端
CN112711530A (zh) 一种基于机器学习的代码风险预测方法及系统
CN111783930B (zh) 一种基于路径状态的神经网络测试充分性评估方法
CN115963344A (zh) 故障检测方法、装置、电子设备及存储介质
CN115794548A (zh) 日志异常的检测方法及装置
CN115130232A (zh) 零件的寿命预测方法、装置、设备、存储介质及程序产品
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
CN113656391A (zh) 数据检测方法及装置、存储介质及电子设备
CN113361701A (zh) 神经网络模型的量化方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination