CN112862012A - 一种基于lstm模型的运维系统异常预警方法、装置及设备 - Google Patents

一种基于lstm模型的运维系统异常预警方法、装置及设备 Download PDF

Info

Publication number
CN112862012A
CN112862012A CN202110346227.1A CN202110346227A CN112862012A CN 112862012 A CN112862012 A CN 112862012A CN 202110346227 A CN202110346227 A CN 202110346227A CN 112862012 A CN112862012 A CN 112862012A
Authority
CN
China
Prior art keywords
data
maintenance
maintenance data
time period
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110346227.1A
Other languages
English (en)
Inventor
肖闪丽
唐宁
陈利燕
苗国宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110346227.1A priority Critical patent/CN112862012A/zh
Publication of CN112862012A publication Critical patent/CN112862012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本文属于IT运维监控领域,具体涉及一种基于LSTM模型的运维系统异常预警方法、装置及设备,所述方法包括:获取目标时段的多种运维数据;通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;当所述异常值超过预警门限值时,则向用户发出异常预警,本文通过训练得到的LSTM模型对在时间序列分布的运维数据进行预测,从而能够快速确定相应时段运维数据的异常程度,实现了运维监控系统的准确快速的异常定位,提高监控能力。

Description

一种基于LSTM模型的运维系统异常预警方法、装置及设备
技术领域
本文属于IT运维监控领域,具体涉及一种基于LSTM模型的运维系统异常预警方法、装置及设备。
背景技术
随着分布式技术的发展、主机下平台的推进,金融行业系统版本迭代速度不断加快,传统的运维方式已经不能应对系统的规模和复杂度的增长。业内通常通过对交易代码的交易量、响应时间、业务成功率和系统成功率根据人为经验配置阈值形成指标,每个指标可以仅配置交易量的阈值,也可以配置交易量、响应时间、业务成功率和系统成功率阈值的组合。通过指标的报警情况来达到监控的目的,从而判断系统是否可以正常对外提供服务,但是当前的运维方式仅仅依赖于运维人员的手工维护,存在着以下问题:交易代码数量庞大,监控指标配置不全,从整体来看,监控指标不够全面,各系统落地联机监控情况参差不齐,监控指标配置成本较高。另外当前指标里大多包含有多个交易代码,交易代码的组合仅仅依赖于开发人员和运维人员的个人经验,当组合里的交易代码的交易量或者响应时间相差较大时,配置指标很难达到设置的报警阈值,因此造成报警的效率低下,很难满足现有的监控要求,因此如何提高运维系统的监控能力,降低监控成本成为目前亟需解决的技术问题。
发明内容
针对现有技术的上述问题,本文的目的在于,提供一种基于LSTM模型的运维系统异常预警方法、装置及设备,能够提高运维系统的监控能力,降低监控成本。
为了解决上述技术问题,本文的具体技术方案如下:
一方面,本文提供一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,所述方法包括:
获取目标时段的多种运维数据;
通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
当所述异常值超过预警门限值时,则向用户发出异常预警。
进一步地,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。
进一步地,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态;
遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;
输入门,用于确定需要在细胞状态中保存的信息;
细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;
输出门,用于确定预测基线对应的输出值。
作为可选地,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:
获取每种运维数据对应的历史运维数据;
对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;
通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;
根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;
根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;
当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;
将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。
作为优选地,所述调整预设LSTM模型的超参数,包括:
对所述PSO进行改进,通过改进后的PSO对LSTM模型的超参数巡优,其中所述超参数包括时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率。
进一步地,所述预警门限值获得过程包括:
获取所述历史运维数据中每个预设时段的实际运维数据;
根据每种运维数据的LSTM模型预测基线,获取每个预设时段的每种运维数据的预测数据;
根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值。
进一步地,所述根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值,包括:
获取所述历史运维数据中的异常数据;
将所述异常数据的对应时段标记为异常时段,其余时段标记为正常时段;
根据所述异常数据和所述异常时段对应的预测数据,按照第一函数计算所述异常时段的第一预警门限值;
根据所述正常时段和所述正常时段对应的预测数据,按照第二函数计算所述正常时段的第二预警门限值。
进一步地,所述方法还包括:
确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数。
优选地,所述确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数,包括:
根据所述运维业务种类,确定不同运维业务种类中各种运维数据的权重关系;
根据所述权重关系,生成针对所述运维业务种类的第二函数。
另一方面,本文还提供一种基于长短期记忆网络LSTM模型的运维系统异常预警装置,所述装置包括:
运维数据获取模块,用于获取目标时段的多种运维数据;
预测基线获取模块,用于通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
预测数据获取模块,用于根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
异常值计算模块,用于根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
异常预警模块,用于当所述异常值超过预警门限值时,则向用户发出异常预警。
另一方面,本文还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述的方法步骤。
最后,本文还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的方法步骤。
采用上述技术方案,本文所述一种基于LSTM模型的运维系统异常预警方法、装置及设备,通过运维系统的历史运维数据训练得到的LSTM模型,得到运维数据的预测基线,从而确定目标时段的运维数据的预测数据,然后根据目标时段的实际数据和预测数据计算得到目标时段运维数据的异常值,通过异常值与预设门限值进行比较,当异常值超过预警门限值时,则向用户发出异常预警,本文通过训练得到的LSTM模型对在时间序列分布的运维数据进行预测,从而能够快速确定相应时段运维数据的异常程度,实现了运维监控系统的准确快速的异常定位。
为让本文的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本文实施例提供的方法的实施环境示意图;
图2示出了本文实施例中提供的一种基于LSTM模型的运维系统异常预警方法步骤示意图;
图3示出了本文实施例中LSTM模型训练过程示意图;
图4示出了本文实施例中预警门限值的计算过程示意图;
图5示出了本文实施例中不同预警门限值计算过程示意图;
图6示出了本文实施例中第二函数生成步骤示意图;
图7示出了本文实施例中数据预处理过程示意图;
图8示出了本文实施例中预测数据获取过程示意图;
图9示出了本文实施例中提供的一种基于LSTM模型的运维系统异常预测装置结构示意图;
图10示出了本文实施例中提供的一种计算机设备的结构示意图。
附图符号说明:
10、运维系统;
20、服务器;
30、监控系统;
40、用户;
100、运维数据获取模块;
200、预测基线获取模块;
300、预测数据获取模块;
400、异常值计算模块;
500、异常预警模块;
1002、计算机设备;
1004、处理器;
1006、存储器;
1008、驱动机构;
1010、输入/输出模块;
1012、输入设备;
1014、输出设备;
1016、呈现设备;
1018、图形用户接口;
1020、网络接口;
1022、通信链路;
1024、通信总线。
具体实施方式
下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文说明书之前对文中的名字进行解释:
LSTM模型(Long-Short Term Memory,长短期记忆模型):一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,具有时间循环结构,能够刻画具有时空关联的序列数据,包括时间序列数据(气温、车流量、销量等)、文本、事件(购物清单、个人行为)等等。
PSO算法(Particle Swarm Optimization,粒子群优化算法):一种进化计算技术(evolutionary computation),源于对鸟群捕食的行为研究,粒子群优化算法的基本思想:是通过群体中个体之间的协作和信息共享来寻找最优解。
现有技术中,金融行业系统版本迭代速度以及业务数量急剧加快,对业务系统的监控要求也越来越高,业内通常通过对交易代码的交易量、响应时间、业务成功率和系统成功率根据人为经验配置阈值形成指标,每个指标可以仅配置交易量的阈值,也可以配置交易量、响应时间、业务成功率和系统成功率阈值的组合。通过指标的报警情况来达到监控的目的,从而判断系统是否可以正常对外提供服务,但是当前的运维方式仅仅依赖于运维人员的手工维护,存在着以下问题:交易代码数量庞大,监控指标配置不全,从整体来看,监控指标不够全面,各系统落地联机监控情况参差不齐,监控指标配置成本较高,上述问题会导致配置很难达到设置的报警阈值,造成报警的效率低下,很大程度上制约着业务系统的正常健康运行。
为了解决上述问题,本说明书实施例提供一种运维系统异常预警方法,如图1所示,为所述方法的实施环境示意图,运维系统10,如金融行业运维系统在实时运行过程中产生的运维数据保存到服务器20中;监控系统30,获取目标时段的多种运维数据;通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;当所述异常值超过预警门限值时,则向用户40发出异常预警。其中监控系统30从所述服务器20中获取历史运维数据进行LSTM模型的训练,以及获取目标时段的运维数据,通常异常值与预警门限值的比较确定是否向用户40预警,从而使得用户及时获悉运维系统的异常情况,便于后续的及时处理。
具体地,本文实施例提供了基于长短期记忆网络LSTM模型的运维系统异常预警方法,能够提高运维系统的监控能力,降低监控成本。图2是本文实施例提供的一种基于LSTM模型的运维系统异常预警方法的步骤示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图2所示,所述方法可以包括:
S101:获取目标时段的多种运维数据;
S102:通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
S103:根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
S104:根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
S105:当所述异常值超过预警门限值时,则向用户发出异常预警。
本说明书实施例提供的方法,通过对历史运维数据进行训练得到LSTM模型,从而能够得到预测未来时段运维运维数据的预测基线,然后根据目标时段的运维数据和根据预测基线得到的预测数据进行计算得到异常值,从而根据异常值和预设的预警门限值进行比较,确定是否向用户发出异常预警。本文能够代替重复性的数据操作和人为经验,提高了运维系统监控的效率和准确性,同时也降低了人为成本。
在实际工作中,对运维系统包括不同的运维业务,因此对运维系统的监控实际上是对不同运维业务的监控,进一步地,每个运维业务是通过不同的交易代码来实现的,因此可以通过每个运维业务中的交易代码的执行情况来判断运维系统的运行状态,交易代码的执行成功与否决定着整个运维系统的运行健康程度,其中所述交易代码的运维数据可以为表示运维系统运行状态的指标参数,比如可以为交易量、交易响应时间、业务成功率、系统成功率,其中所述交易量可以表示在一定时间维度内交易代码的运行次数,所述交易响应时间可以为所述交易代码在该时间维度内的平均响应时间,所述业务成功率可以为所述交易代码对应的运维业务在该时间维度内的成功运行次数与运行次数之比,比如账号登录业务,所述业务成功率为客户输入密码成功次数与尝试输入总次数之比,所述系统成功率可以为所述运维业务所在系统能否正常运行,比如出现系统死机等情况为系统失败次数,减去失败次数即为成功次数,然后计算相应的成功率。
在本说明书实施例中,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。比如,以一天为一周期,以分钟维度为预设时段,这样在一个周期内就有1440个数据,因此可以获取过去连续40天的数据作为历史运维数据进行训练。
需要说明的是,本申请中使用LSTM模型是根据处理和预测时间序列数据的模型,因此在时间上的数据需要具有一定的相关性,比如在工作日的每一个周期内(比如一天),运维系统中交易代码的运行特征呈现很强的时间相关性,比如高峰运行段和低谷运行段等平稳的周期性变化,这样就可以通过周期内的数据进行预测,因此在本说明书实施例中,可以将工作日和非工作日的历史数据分开计算,在实际计算中,可以只需考虑工作日的历史运维数据进行训练,并计算后续工作日运维数据的预测。
在本说明书实施例中,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态,细胞的状态能够随时间流动,作为LSTM中新增加的一路输入输出,细胞状态可以决定保留与遗忘的信息;
遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;
输入门,用于确定需要在细胞状态中保存的信息;
细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;
输出门,用于确定预测基线对应的输出值。
所述LSTM模型结构是时间递归神经网络常用的学习模型,在本说明书实施例中,所述LSTM模型的结构形式及不同结构的功能描述不做赘述。
在本说明书实施例中,如图3所示,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:
S201:获取每种运维数据对应的历史运维数据;
S202:对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;
S203:通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;
S204:根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;
S205:根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;
S206:当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;
S207:将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。
所述历史运维数据可以为呈周期性分布的多组运维数据,可以根据运行系统中服务器的数量进行统计,若系统有多个服务器,则对服务器个数进行叠加,比如一个系统有两台服务器,IP分别为183.44.66.1和183.44.66.2,则IP汇总值为2;其中,交易代码的交易量单位为个数,响应时间单位为ms,业务成功率和系统成功率均按百分比计算。分别取一个交易代码工作日和非工作日过去40天按分钟维度的数据,则工作日和非工作日的数据集为[(交易量,响应时间,业务成功率,系统成功率)=(40*1440,40*1440,40*1440,40*1440)]。
其中对所述历史运维数据的预处理可以为剔除异常数据和对数据进行标准化处理,其中作为可选点,如图7所示,为与处理的流程图,可以通过如下两种方式对数据异常点进行判别和剔除;
1)获取实体对象(如金融对象)的生产运行系统及其事件变更事件,从而获取系统的升级时间、异常时间,并对运维人员人工标记的“异常”标签的时段判别为异常数据,然后将这些异常数据从数据集中剔除。
2)对于数据集剩余数据分别计算交易量、响应时间、业务成功率和系统成功率的变异系数,并对同一代码历史同一时刻的交易量、响应时间、业务成功率和系统成功率的变异系数进行累加,按照大小排序,定义前面一定数据(比如30个)数据为异常数据进行剔除,以减少毛刺数据对训练结果的影响;其中变异系数计算公式如下:
Figure BDA0003000886610000101
Figure BDA0003000886610000102
Figure BDA0003000886610000103
其中,K为数据集中剩余的数据数量,xi分别代表交易量、响应时间、业务成功率和系统成功率的值,u为平均值,σ为标准差,C.V为变异系数。
通过上述两个方式就可以对历史运维数据中的异常数据进行剔除,为了保证整个数据量的完整性,可以对于缺少的数据从历史同一时刻且判定为正常数据中进行随机选取来完成数据集的完整填充,并对数据集中的交易量、响应时间按照Min-Max规范化,将数据映射到[0,1]之间,公式如下:
Figure BDA0003000886610000104
其中xnorm为归一化后的数据,x为原始运维数据,xmax和xmin分别为数据集的最大值和最小值。
通过对异常数据剔除和实现标准化处理的数据集可以用于训练LSTM模型,作为可选地,将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据,通过训练集数据对LSTM模型进行训练,然后通过验证集数据对训练后的模型可靠性进行校正,以训练后的模型预测值和验证集数据的差值作为适应度函数,所述适应度函数的函数值越小则表示真实值和预测值的差值越小,训练得到的LSTM模型预测效果越好。其中所述适应度函数的计算公式如下:
Figure BDA0003000886610000111
其中,N为验证集数据的数量,yi'标示第i个数据的预测值,yi表示i个数据的真实值。
由于LSTM的超参数比如时间窗口大小、批处理数量、隐藏层单元数目和学习率人为设置难且需要根据不同的数据特点设置不同的参数值,因此在实际模型搭建和训练的过程中,根据每种运维数据都会搭建一个LSTM模型,并且其中的超参数也会不同,对每个LSTM模型中超参数的优选可以结合粒子群算法(PSO)实现简单、快速的搜索,如图8所示,为LSTM模型的超参数寻优和模型预测的逻辑示意图。
其中,PSO算法对LSTM模型超参数进行寻优的过程可以为:
步骤1:PSO算法初始化,包括:种群规模N,粒子位置x和速度v,粒子维数D,惯性权值w,学习因子c1、c2,粒子全局最优位置gbest,个体最优历史位置pbest,粒子最优维度个体pbestbin,学习概率pc,精英概率pm,随机向导学习持续代数阈值s,最大迭代次数tmax,目标向量(适应度函数)f。
步骤2:根据下列公式确定粒子的邻居个数。在粒子邻居数增长模型中,当任意两个粒子满足下面公式时,认定上述两粒子为邻居关系:
Figure BDA0003000886610000112
其中,xi和xbin为种群中任意两粒子;t为算法当前迭代次数,tmax为算法最大迭代次数;dmax是任意两个粒子间的最大距离。这样使算法在初始迭代时有较好的探索性能,而在迭代后期有较好的开发性能。
步骤3:设定每个粒子的位置为Xi=[xi1,xi2,…,xiD],粒子的移动速度为vi=[vi1,vi2,…,viD],则PSO算法第i个粒子在第t+1代的速度和位置更新公式分别如下所示:
vi,j(t+1)=wvi,j(t)+c1r1(pbesti,j(t)-xi,j(t))+c2r2(gbestj(t)-xi,j(t)) (7)
xi,j(t+1)=xi,j(t)+vi,j(t+1) (8)
其中,i=1,2,…,NUM表示粒子的总个数;j=1,2,…D表示粒子i的总维数;w为惯性权重,代表了粒子先前速度对下一代速度的影响;c1和c2分别为粒子向个体最优、全局最优位置学习的因子,r1和r2为[0,1]范围内的随机数;pbest为粒子的个体最优位置;gbest代表种群找到的全局最优位置;pbesti,j和gbestj的第t+1代的更新方式分别如下式所示:
Figure BDA0003000886610000121
gbestj(t+1)=min(pbesti,j(t+1)),i=1,…,NUM (10)
为了防止PSO算法陷入局部最优,对PSO算法进行改进,设定当pbest连续三代位置没有发生变化时,从pbest中随机选取|D/2|维(向上取整)进行变异,记为pbestbin,然后按下面公式更新粒子速度公式,n和m分别从[1-D]中随机选取,且保证n+m≤D。
①随机选出粒子i的m(j∈m)个维数,根据公式(11)使粒子i向gbest学习:
vi,j=wvi,j+rand()(gbestj-xi,j) (11)
②再随机选出粒子i的n(j∈n)个维数,根据公式(12)使粒子i变异组成的新个体pbestbin学习:
vi,j=wvi,j+rand()(pbestbin[j]-xi,j) (12)
③剩余维数D-m-n(j∈D-m-n)根据公式(13)使粒子i向自身的pbest学习:
vi,j=wvi,j+rand()(pbesti,j-xi,j) (13)
步骤4:PSO参数设定:由于需要对LSTM的5个参数巡优,即时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率,则可以得出粒子的维度个数为5,则粒子的位置可以记为xi,j=[xi,1,xi,2,xi,3,xi,4,xi,5]。为了使搭建的LSTM网络具有合理性且涉及参数可以进行快速寻优,减少对服务器资源的消耗,人为设定时间窗口大小取值范围[1-20],隐藏层单元个数取值范围为[15-40],批处理大小取值范围[5-60],学习率取值范围[0.01-0.04],即[xi,1,xi,2,xi,3,xi,4,xi,5]和[vi,1,vi,2,vi,3,vi,4,vi,5]分别要在以上范围内进行随机赋值。根据经验,设定粒子种群规模为200,最大迭代次数为300,学习因子c1和c2均为2,惯性权值w随着迭代次数从0.9线性递减到0.4。
步骤5:对LSTM模型进行训练,PSO算法进行不断的迭代,gbest所对应的值即为LSTM的时间窗口大小、批处理数量、隐藏层单元数目和学习率,以此得到预测值,利用公式(5)计算粒子适应度值(适应度函数),即预测值和测试值之间的差值,当所述差值达到预设门限值时,则停止搜索,并将相应的超参数确定为最终设定值。其中根据公式(9)和(10)计算得出粒子的pbest和gbest。
步骤6:超参数的更新,当pbest连续三代位置没有发生变化时,从pbest中随机选取|D/2|维进行变异组合成新变异粒子pbestbin,则根据公式(11)、(12)、(13)进行更新粒子速度,否则根据公式(2)更新粒子的速度。其中,根据公式(8)更新粒子的位置。
步骤7:超参数确定,如果达到迭代次数,则停止搜索,输出的gbest即为搭建LSTM模型使用的最终设定值。
通过上述改进的PSO算法可以实现不同特征的运维数据的LSTM模型超参数的确定,从而提高了所述LSTM模型预测的准确性。
在已经确定了针对每个运维数据的LSTM模型之后,为了准确的判断后续运维数据的异常程度,并及时向运维人员进行提醒,因此本说明书实施例中,如图4所示,所述预警门限值可以通过如下方式获得:
S301:获取所述历史运维数据中每个预设时段的实际运维数据;
S302:根据每种运维数据的LSTM模型预测基线,获取每个预设时段的每种运维数据的预测数据;
S303:根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值。
可以理解为,每个预设时段都对应着一个预警门限值,为了确保所述预警门限值的可靠性和准确性,可以通过历史运维数据以及训练完成的LSTM模型预测数据进行比较得到能够体现数据异常程度的异常值。
在实际工作中,历史运维数据也存在着被运维人员人工打标的异常数据,该异常数据对应的时间段则为异常时间段,因此在每个周期的该时间段都可以成为异常时间段,其余时间段则为正常时间段,在已经获得历史运维数据中的异常数据时,则可以通过所述异常数据作为后续相应时间段异常数据判断的标准,作为可选地,如图5所示,所述根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值,包括:
S401:获取所述历史运维数据中的异常数据;
S402:将所述异常数据的对应时段标记为异常时段,其余时段标记为正常时段;
S403:根据所述异常数据和所述异常时段对应的预测数据,按照第一函数计算所述异常时段的第一预警门限值;
S404:根据所述正常时段和所述正常时段对应的预测数据,按照第二函数计算所述正常时段的第二预警门限值。
其中,所述第一函数是通过异常数据和预测数据确定的,作为可选地,可以通过如下公式得到:
Figure BDA0003000886610000141
预警门限值=∑偏离度 (15)
示例性地,针对一交易代码,该交易代码对应的所述运维数据可以包括交易量、响应时间、业务成功率和系统成功率,对异常数据所在的异常时段,通过对它们对应的预测值分别进行偏离度计算,并将所计算出来的四个偏离度值进行累加,记为该时段的预警门限值,若未来这一时段该交易代码偏离度累加值大于该值,则定位交易异常。
需要说明的是,当所述异常时段对应多组异常数据时,则对每种运维数据的偏离度的计算可以得到多组偏离度,因此可以计算多组偏离度的平均值作为每种运维数据的偏离度,从而得到该异常时段的预警门限值,通过平均偏离度的计算可以提高预警门限值的准确度,避免过大或过小的异常值被误触发预警。
当某个时段被确定为正常时段时,无法通过异常数据进行预警门限值的判断,可以设定真实值与预测值的偏离程度作为判断的标准,因此所述第二函数中关于偏离度的计算可以为:
Figure BDA0003000886610000142
可以理解为,通过设置预警值和实际值的偏离程度可以确定针对每个时段的预警门限值,另外根据不同类型的运维数据,所述预设偏离度也不相同,然后通过公式(15)就能得到所述运维数据的预警门限值。示例性地,对F-AAB这个应用,可以分别配置交易量往下波动(预设偏离度20%)、交易响应时间向上波动(预设偏离度10%)、业务成功率向下波动(预设偏离度10%)、系统成功率向下波动(预设偏离度5%)的偏离度。其中所述预设偏离度也可以根据不同运维数据对应运维业务的敏感程度设置,这样可以对不同业务进行个性化的预警门限值设置,提高了预警门限值的精准性。
当然,由于存在较多的正常时段,因为可以计算所有周期内的所有正常时段偏离度的平均值作为单个正产时段的偏离度,这样可以减少部分误差较大数据的影响,但是由于将全部正常运维数据都需计算偏离度,必然需要很大的工作量,为了减少能耗,还可以选择部分正常时段的数据进行偏离度和预警门限值的计算,这样可以提高计算效率。
在一些其他实施例中,由于历史运维数据的异常数据的异常程度可能很高,因此通过该异常时段计算得到的预警门限值也可能较大,这样可能导致较小的异常数据不能被正常识别,因此在实际工作中,所有时段的预警门限值也可以通过第二函数来计算,这样可以统一判断运维数据的异常程度,提高了预警的可靠性。
在本说明书实施例中,每组运维数据可以表示相应地运维业务中交易代码的运行状况,不同的交易代码对应着不同的运维数据,不同的运维数据的时间特征也不完全一致,因此不同的交易代码也可以有不同的预警门限值。
因此进一步实施例中,所述方法还包括:确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数。
通过不同的运维业务种类确定不同第二函数,可以提高对不同运维业务预警的针对性,避免了现有技术中只设置一个预警值进行预警,提高了预警的准确定和智能化。
另外,由于不同的运维业务对不同运维数据的敏感程度不同,比如登录账号业务,对交易响应时间敏感度较高,门禁通行业务对业务成功率敏感度较高等,因此可以进一步设置不同业务对应运维数据的敏感度,提高预警门限值的可靠性。
作为可选地,如图6所示,所述确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数,包括:
S501:根据所述运维业务种类,确定不同运维业务种类中各种运维数据的权重关系;
S502:根据所述权重关系,生成针对所述运维业务种类的第二函数。
可以理解为,当对正常时段的数据进行预警门限值计算时,还可以根据四个交易类型数据的敏感程度赋予不同的权重来进行异常点的判别,具体的权重根据实际情况设置,比如,对F-AAB这个应用,可以分别配置交易量往下波动(预设偏离度20%)、交易响应时间向上波动(预设偏离度10%)、业务成功率向下波动(预设偏离度10%)、系统成功率向下波动(预设偏离度5%)的偏离度,触发偏离度则为1,否则为0,并设置交易量、响应时间、业务成功率和系统成功率这4个交易数据类型的权重分别为10%,30%,30%和30%。偏离度可以通过公式(16)计算,预警门限值的计算公式如下所示:
报警门限值=∑偏离度阈值触发(0/1)*指标权重 (17)
本说明书实施例,通过上述提供的一种基于LSTM模型的运维系统异常预警方法,通过运维系统的历史运维数据训练得到的LSTM模型,得到运维数据的预测基线,从而确定目标时段的运维数据的预测数据,然后根据目标时段的实际数据和预测数据计算得到目标时段运维数据的异常值,通过异常值与预设门限值进行比较,当异常值超过预警门限值时,则向用户发出异常预警,本文使用改进的PSO算法对LSTM模型的关键参数进行寻优,使系统监控数据特征与LSTM网络结构相匹配,在应用规模、复杂度和迭代速度三重增长的常态下,不受系统升级、交易代码增多的影响,只需要交给“机器”处理,由智能预警门限值代替人工经验阈值,替代重复性的数据操作和人为经验,并设置异常点判别规则、异常点可视化展现、个性化配置来提高监控的准确率,节省了人力成本的同时也提高了系统对外服务水平。
在实际工作中,还可以根据实际情况设置LSTM模型的更新频率,比如以月为周期对历史数据进行LSTM模型的重新训练,从而确保后续时段数据预测的准确性。另外,也可以设置报警等级和报警压缩频率,根据不同交易代码的重要程度设置不同的报警等级,比如可以设置亮灯颜色的不同,或提示语音等方式。实例中:4个交易数据类型权重调整以及预警门限值调整,若没有调整,则按照默认值计算。其中,预测值的更新频率默认为7天,运维人员可以根据需求进行调整。根据异常点报表以及不同交易代码的重要程度,运维人员可以自主调整报警等级,默认为5级;对于预警次数的处理中,默认设置连续发生3次报警,运维人员可根据系统的业务类型、交易的重要程度进行报警压缩频率设置,比如设置连续发生5次预警则进行报警。交易数据类型权重以及报警阈值支持运维人员根据节假日、夜间时间段、交易代码的敏感程度进行人为调整,调整之后实时更新异常点数据。
在上述提供的方法基础上,如图9所示,本说明书实施例还提供一种基于LSTM模型的运维系统异常预警装置,所述装置包括:
运维数据获取模块100,用于获取目标时段的多种运维数据;
预测基线获取模块200,用于通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
预测数据获取模块300,用于根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
异常值计算模块400,用于根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
异常预警模块500,用于当所述异常值超过预警门限值时,则向用户发出异常预警。
通过上述提供的装置所取得的有益效果和上述提供的方法所取得的有益效果一致,本说明书不做赘述。
如图10所示,为本文实施例提供的一种计算机设备,所述计算机设备1002可以包括一个或多个处理器1004,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备1002还可以包括任何存储器1006,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器1006可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备1002的固定或可移除部件。在一种情况下,当处理器1004执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备1002可以执行相关联指令的任一操作。计算机设备1002还包括用于与任何存储器交互的一个或多个驱动机构1008,诸如硬盘驱动机构、光盘驱动机构等。
计算机设备1002还可以包括输入/输出模块1010(I/O),其用于接收各种输入(经由输入设备1012)和用于提供各种输出(经由输出设备1014))。一个具体输出机构可以包括呈现设备1016和相关联的图形用户接口(GUI)1018。在其他实施例中,还可以不包括输入/输出模块1010(I/O)、输入设备1012以及输出设备1014,仅作为网络中的一台计算机设备。计算机设备1002还可以包括一个或多个网络接口1020,其用于经由一个或多个通信链路1022与其他设备交换数据。一个或多个通信总线1024将上文所描述的部件耦合在一起。
通信链路1022可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1022可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
对应于图2-图6中的方法,本文实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
本文实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行如图2至图6所示的方法。
应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。

Claims (12)

1.一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,其特征在于,所述方法包括:
获取目标时段的多种运维数据;
通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
当所述异常值超过预警门限值时,则向用户发出异常预警。
2.根据权利要求1所述的预警方法,其特征在于,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。
3.根据权利要求1所述的预警方法,其特征在于,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态;
遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;
输入门,用于确定需要在细胞状态中保存的信息;
细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;
输出门,用于确定预测基线对应的输出值。
4.根据权利要求1所述的预警方法,其特征在于,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:
获取每种运维数据对应的历史运维数据;
对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;
通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;
根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;
根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;
当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;
将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。
5.根据权利要求4所述的预警方法,其特征在于,所述通过粒子群优化算法PSO对LSTM模型的超参数巡优,包括:
对所述PSO进行改进,通过改进后的PSO对LSTM模型的超参数巡优,其中所述超参数包括时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率。
6.根据权利要求1所述的预警方法,其特征在于,所述预警门限值获得过程包括:
获取所述历史运维数据中每个预设时段的实际运维数据;
根据每种运维数据的LSTM模型预测基线,获取每个预设时段的每种运维数据的预测数据;
根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值。
7.根据权利要求6所述的预警方法,其特征在于,所述根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值,包括:
获取所述历史运维数据中的异常数据;
将所述异常数据的对应时段标记为异常时段,其余时段标记为正常时段;
根据所述异常数据和所述异常时段对应的预测数据,按照第一函数计算所述异常时段的第一预警门限值;
根据所述正常时段和所述正常时段对应的预测数据,按照第二函数计算所述正常时段的第二预警门限值。
8.根据权利要求7所述的预警方法,其特征在于,所述方法还包括:
确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数。
9.根据权利要求8所述的预警方法,其特征在于,所述确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数,包括:
根据所述运维业务种类,确定不同运维业务种类中各种运维数据的权重关系;
根据所述权重关系,生成针对所述运维业务种类的第二函数。
10.一种基于LSTM模型的运维系统异常预警装置,其特征在于,所述装置包括:
运维数据获取模块,用于获取目标时段的多种运维数据;
预测基线获取模块,用于通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
预测数据获取模块,用于根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
异常值计算模块,用于根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
异常预警模块,用于当所述异常值超过预警门限值时,则向用户发出异常预警。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的方法步骤。
CN202110346227.1A 2021-03-31 2021-03-31 一种基于lstm模型的运维系统异常预警方法、装置及设备 Pending CN112862012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110346227.1A CN112862012A (zh) 2021-03-31 2021-03-31 一种基于lstm模型的运维系统异常预警方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110346227.1A CN112862012A (zh) 2021-03-31 2021-03-31 一种基于lstm模型的运维系统异常预警方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112862012A true CN112862012A (zh) 2021-05-28

Family

ID=75991983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110346227.1A Pending CN112862012A (zh) 2021-03-31 2021-03-31 一种基于lstm模型的运维系统异常预警方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112862012A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657628A (zh) * 2021-08-20 2021-11-16 武汉霖汐科技有限公司 工业设备监控方法、系统、电子设备及存储介质
CN113963520A (zh) * 2021-10-22 2022-01-21 西安忒亚科技有限公司 一种集输管线压力的报警算法
CN114338458A (zh) * 2021-12-24 2022-04-12 山石网科通信技术股份有限公司 数据安全检测方法及装置
CN114726751A (zh) * 2022-04-07 2022-07-08 广州汇智通信技术有限公司 资源质量监控的智能化预警方法、系统、设备和存储介质
CN115829160A (zh) * 2022-12-29 2023-03-21 上海鼎茂信息技术有限公司 一种时序异常预测方法、装置、设备及存储介质
CN116068479A (zh) * 2023-03-07 2023-05-05 潍柴动力股份有限公司 燃料电池耐久试验中输出性能信号的异常检测方法与装置
CN116342246A (zh) * 2023-03-06 2023-06-27 浙江孚临科技有限公司 违约风险评估方法、设备与存储介质
CN116596512A (zh) * 2023-05-22 2023-08-15 湖北华中电力科技开发有限责任公司 一种基于信息系统的电力运维安全强化方法和系统
CN117113267A (zh) * 2023-10-25 2023-11-24 杭州海兴泽科信息技术有限公司 基于大数据的预测模型训练方法、光伏发电性能检测方法
CN117290364A (zh) * 2023-11-24 2023-12-26 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117354171A (zh) * 2023-12-06 2024-01-05 北京智麟科技有限公司 基于物联网平台的平台健康状况预警方法及系统
CN117708707A (zh) * 2024-02-06 2024-03-15 国网安徽省电力有限公司营销服务中心 大数据下台区线损率异常智能预警方法和系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657628A (zh) * 2021-08-20 2021-11-16 武汉霖汐科技有限公司 工业设备监控方法、系统、电子设备及存储介质
CN113963520A (zh) * 2021-10-22 2022-01-21 西安忒亚科技有限公司 一种集输管线压力的报警算法
CN114338458A (zh) * 2021-12-24 2022-04-12 山石网科通信技术股份有限公司 数据安全检测方法及装置
CN114726751A (zh) * 2022-04-07 2022-07-08 广州汇智通信技术有限公司 资源质量监控的智能化预警方法、系统、设备和存储介质
CN115829160B (zh) * 2022-12-29 2023-09-01 上海鼎茂信息技术有限公司 一种时序异常预测方法、装置、设备及存储介质
CN115829160A (zh) * 2022-12-29 2023-03-21 上海鼎茂信息技术有限公司 一种时序异常预测方法、装置、设备及存储介质
CN116342246B (zh) * 2023-03-06 2024-04-23 浙江孚临科技有限公司 违约风险评估方法、设备与存储介质
CN116342246A (zh) * 2023-03-06 2023-06-27 浙江孚临科技有限公司 违约风险评估方法、设备与存储介质
CN116068479A (zh) * 2023-03-07 2023-05-05 潍柴动力股份有限公司 燃料电池耐久试验中输出性能信号的异常检测方法与装置
CN116596512A (zh) * 2023-05-22 2023-08-15 湖北华中电力科技开发有限责任公司 一种基于信息系统的电力运维安全强化方法和系统
CN116596512B (zh) * 2023-05-22 2024-05-10 湖北华中电力科技开发有限责任公司 一种基于信息系统的电力运维安全强化方法和系统
CN117113267A (zh) * 2023-10-25 2023-11-24 杭州海兴泽科信息技术有限公司 基于大数据的预测模型训练方法、光伏发电性能检测方法
CN117113267B (zh) * 2023-10-25 2024-02-09 杭州海兴泽科信息技术有限公司 基于大数据的预测模型训练方法、光伏发电性能检测方法
CN117290364A (zh) * 2023-11-24 2023-12-26 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117290364B (zh) * 2023-11-24 2024-01-30 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117354171A (zh) * 2023-12-06 2024-01-05 北京智麟科技有限公司 基于物联网平台的平台健康状况预警方法及系统
CN117354171B (zh) * 2023-12-06 2024-03-12 北京智麟科技有限公司 基于物联网平台的平台健康状况预警方法及系统
CN117708707A (zh) * 2024-02-06 2024-03-15 国网安徽省电力有限公司营销服务中心 大数据下台区线损率异常智能预警方法和系统
CN117708707B (zh) * 2024-02-06 2024-05-17 国网安徽省电力有限公司营销服务中心 大数据下台区线损率异常智能预警方法和系统

Similar Documents

Publication Publication Date Title
CN112862012A (zh) 一种基于lstm模型的运维系统异常预警方法、装置及设备
CN110865929B (zh) 异常检测预警方法及系统
CN108052528B (zh) 一种存储设备时序分类预警方法
KR101966557B1 (ko) 빅데이터와 머신러닝을 이용한 수리부속수요 예측 시스템 및 방법
WO2016144586A1 (en) Prediction in building automation
WO2019011015A1 (zh) 一种进行业务调度的方法和装置
US20090138306A1 (en) Facility risk assessment systems and methods
CN108320016A (zh) 一种建筑能耗短期预测方法
CN115098330A (zh) 基于云边协同模式的设备异常检测系统及方法
CN103197983A (zh) 基于概率图模型的服务组件可靠性在线时间序列预测方法
CN109388678A (zh) 使用异构源进行电梯状况监测
CN115660226B (zh) 电力负荷的预测模型构建方法和基于数字孪生的构建装置
Qiao et al. Feature selection strategy for machine learning methods in building energy consumption prediction
WO2024065988A1 (zh) 设备监测方法和系统、电子设备、存储介质
CN114611372A (zh) 一种基于物联网边缘计算的工业设备健康预测方法
CN109410502A (zh) 火灾预警方法及装置
CN117494292A (zh) 一种基于bim和ai大模型的工程进度管理方法及系统
CN116457802A (zh) 利用未被标记的传感器数据对工业系统中的罕见故障的自动实时检测、预测和阻止
CN115994611A (zh) 类别预测模型的训练方法、预测方法、设备和存储介质
CN114266602A (zh) 电力物联网多源数据融合的深度学习电价预测方法和装置
CN112527572A (zh) 磁盘故障预测方法、装置、计算机可读存储介质及服务器
CN116010187A (zh) 一种日志检测方法以及相关装置
US20230008936A1 (en) System and method for adaptive learning for hospital census simulation
US11915180B2 (en) Systems and methods for identifying an officer at risk of an adverse event
JP7297816B2 (ja) 資産の予測健全性解析を実行するための方法およびコンピューティングシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination