CN112115024A - 一种用于故障预测神经网络模型的训练方法与设备 - Google Patents

一种用于故障预测神经网络模型的训练方法与设备 Download PDF

Info

Publication number
CN112115024A
CN112115024A CN202010916672.2A CN202010916672A CN112115024A CN 112115024 A CN112115024 A CN 112115024A CN 202010916672 A CN202010916672 A CN 202010916672A CN 112115024 A CN112115024 A CN 112115024A
Authority
CN
China
Prior art keywords
index data
neural network
historical
prediction
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010916672.2A
Other languages
English (en)
Other versions
CN112115024B (zh
Inventor
王洪涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Suninfo Technology Co ltd
Original Assignee
Shanghai Suninfo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Suninfo Technology Co ltd filed Critical Shanghai Suninfo Technology Co ltd
Priority to CN202010916672.2A priority Critical patent/CN112115024B/zh
Publication of CN112115024A publication Critical patent/CN112115024A/zh
Priority to PCT/CN2021/090028 priority patent/WO2022048168A1/zh
Application granted granted Critical
Publication of CN112115024B publication Critical patent/CN112115024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请通过一种用于故障预测神经网络模型的训练方法与设备,首先获取被监控点的历史指标数据集,其中,所述历史指标数据集由在不同历史时间点采集到的所述被监控点的监控指标数据组成,接着基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集,然后基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。通过该方法获得经过训练的神经网络模型,用于对被监控的计算机运行状态或者业务状态进行故障预测,可让运维人员提前介入,有效预防故障异常的发生或及时消除故障,可有效增大MTBF或减少MTTR。

Description

一种用于故障预测神经网络模型的训练方法与设备
技术领域
本申请涉及计算机数据处理技术领域,尤其涉及一种用于故障预测神经网络模型的训练的技术。
背景技术
目前在对各类计算机特别是大量用于数据运算、存储服务器的日常运维实践中,监控指标广泛地应用于对计算机服务器健康状态进行监控,例如:CPU使用率、内存使用率等,也应用于对在计算机服务器上运行的业务的状态进行监控,例如:每分钟的业务量、单位时间内网卡的流入及流出数据量等。
现有技术是通过设置监控指标的固定阈值和/或者动态阈值的方法,离线或实时判断监控指标是否异常,但是,这些方法都只能发现正在或者已经发生的异常,属于一种事后监控手段,不能够在异常发生之前,提前预测。
发明内容
本申请的目的是提供一种用于故障预测神经网络模型的训练方法与设备,用以解决现有技术中不能够在被监控的计算机运行状态异常发生之前,提前预测的技术问题。
根据本申请的一个方面,提供了一种用于故障预测神经网络模型的训练方法,其中,所述方法包括:
获取被监控点的历史指标数据集,其中,所述历史指标数据集由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集;
基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
可选地,其中,所述基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集包括:
基于预设周期,确定采样数量N;
遍历所述历史指标数据集中的历史指标数据,构建不同时间点的历史指标数据序列,其中,所述不同时间点的历史指标数据序列是由该时间点前的N个历史指标数据组成;
将不同时间点的历史指标数据确定为该时间点对应的历史指标数据序列的真值标注;
基于所述历史指标数据序列及所述真值标注,确定所述训练集及测试集,其中,所述训练集及测试集中的样本包括不同时间点的历史指标数据序列及对应的真值标注。
可选地,其中,在构建不同时间点的历史指标数据序列之前,所述方法还包括:
对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
可选地,其中,所述神经网络是LSTM神经网络,所述LSTM神经网络的结构包括:
1个输入层;
2个LSTM隐含层;
1个全连接输出层。
可选地,其中,所述输出误差包括均方误差。
可选地,其中,所述方法还包括:
获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
可选地,其中,所述方法还包括:
将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
可选地,其中,所述方法还包括:
基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
根据本申请的另一方面,还提供了一种用于故障预测神经网络模型的训练设备,其中,所述设备包括:
第一装置,用于获取被监控点的历史指标数据集,其中,所述历史指标数据集是由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
第二装置,用于基于预设周期及采样频率,对所述历史指标数据集进行处理,以确定训练集及测试集;
第三装置,用于基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
可选地,其中,所述设备还包括:
第四装置,用于对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
可选地,其中,所述设备还包括:
第五装置,用于获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
第六装置,用于基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
第七装置,用于将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
可选地,其中,所述设备还包括:
第八装置,用于将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
可选地,其中,所述设备还包括:
第九装置,用于基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
与现有技术相比,本申请通过一种用于故障预测神经网络模型的训练方法与设备,首先获取被监控点的历史指标数据集,接着基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集,然后基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。通过该方法,可获得经过训练的神经网络模型,用于对被监控的计算机运行状态或者业务状态进行故障预测,可让运维人员提前介入,有效预防故障异常的发生,可有效增大MTBF(Mean Time Between Failure,平均无故障工作时间),或者在故障异常不可避免情况下,提前为故障异常恢复做准备,在故障发生时及时消除,有效减少MTTR(Mean Time To Restoration,平均故障恢复时间)。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于故障预测神经网络模型的训练方法流程图;
图2示出根据本申请一个方面的一种用于故障预测神经网络模型的训练设备示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,系统各模块和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为更进一步阐述本申请所采取的技术手段及取得的效果,下面结合附图及优选实施例,对本申请的技术方案,进行清楚和完整的描述。
图1示出本申请一个方面的一种用于故障预测神经网络模型的训练方法流程图,其中,一个实施例的方法包括:
S11获取被监控点的历史指标数据集,其中,所述历史指标数据集由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
S12基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集;
S13基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
在本申请中,所述方法通过设备1执行,所述设备1为计算机设备和/或云,所述计算机设备包括但不限于个人计算机、笔记本电脑、工业计算机、网络主机、单个网络服务器、多个网络服务器集;所述云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。
在此,所述计算机设备和/或云仅为举例,其他现有的或者今后可能出现的设备和/或资源共享平台如适用于本申请也应包含在本申请的保护范围内,在此,以引用的方式包含于此。
在该实施例中,在所述步骤S11中,设备1获取被监控点的历史指标数据集,其中,所述被监控点设置在被监控设备上,或者针对被监控设备上运行的业务状态而设置。
例如,设备1通过SNMP(Simple Network Management Protocol,简单网络管理协议)或其它协议抓取、监控代理推送等方式直接获取被监控设备的监控点的指标数据,例如,被监控计算机的CPU、内存,或者是被监控设备上运行业务的指标数据,例如被监控计算机的网络流量。
对于无法直接获取的指标数据,设备1可以通过先获取被监控设备上的操作系统或者业务的运行操作日志,然后对运行操作日志进行处理,比如按关键字或者使用聚类算法对运行操作日志进行分类,获取到不同时间点或时间窗口内同类日志的操作次数统计值。
例如,在设备192.168.212.22上获取被监控计算机192.168.211.124访问30443端口的访问日志如下:
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:16:25:03+0800]"GET/HTTP/1.1"200 10799"https://192.168.211.22:30443/verifypasslog/detail/id/6""Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36"
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:16:25:03+0800]"GET/themes/blue/css/login.css HTTP/1.1"200 5530"https://192.168.211.22:30443/""Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36"
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:17:25:03+0800]"GET/js/jquery-1.7.2.min.js HTTP/1.1"304 0"https://192.168.211.22:30443/""Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36"
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:18:25:03+0800]"GET/js/jquery.placeholder.js HTTP/1.1″304 0″https://192.168.211.22:30443/″″Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36″
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:19:25:03+0800]″GET/default/getcodes HTTP/1.1″200 5892″https://192.168.211.22:30443/″″Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36″
192.168.212.124 192.168.211.22:30443-[16/Aug/2017:19:25:03+0800]″GET/themes/blue/images/oma_login_bg.jpg HTTP/1.1″304 0″https://192.168.211.22:30443/themes/blue/css/login.css″″Mozilla/5.0(Windows NT 6.1;Win64;x64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/73.0.3683.86Safari/537.36″
若按照1小时作为采集时间窗口,统计1个小时内的访问次数,可以统计出一个不同时间点访问量数据集如下表1,
表1
采集时间窗口 访问次数
16:00 2
17:00 1
18:00 1
19:00 2
同样地,也可以统计出关于不同时间点访问/default/getcodes页面次数的数据集如表2,
表2
采集时间窗口 访问次数
16:00 0
17:00 0
18:00 0
19:00 1
在步骤S11中,所述历史指标数据集由在不同历史时间点采集到的所述被监控点的监控指标数据组成,其中,所述不同历史时间点中,相邻历史时间点的间隔是相同的,要求历史指标数据集包含足够数量的监控指标数据以用于训练。
继续在该实施例中,在所述步骤S12中,设备1基于预设周期,对获得的历史指标数据集进行处理,以确定训练集及测试集。
可选地,其中,所述基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集包括:
基于预设周期,确定采样数量N;
遍历所述历史指标数据集中的历史指标数据,构建不同时间点的历史指标数据序列,其中,所述不同时间点的历史指标数据序列是由该时间点前的N个历史指标数据组成;
将不同时间点的历史指标数据确定为该时间点对应的历史指标数据序列的真值标注;
基于所述历史指标数据序列及所述真值标注,确定所述训练集及测试集,其中,所述训练集及测试集中的样本包括不同时间点的历史指标数据序列及对应的真值标注。
例如,在预设时间周期T包含N个时间点采集的监控指标数据,若相邻时间点的时间间隔Tb相同,则一个预设时间周期T内的监控指标数据采集时间点数量N为T/Tb,若Tb为1,则N在数值上与T相同,即在一个预设时间周期T内有T个时间点,对应由T个历史指标数据。将t(在数值上,t要大于等于T+1)时间点采集的历史指标数据st之前的T+1个历史指标数据st-T+1、st-T、st-T-1……st-2、st-1组成一个包含T+1个历史指标数据的历史指标数据序列St-1{st-T+1、st-T、st-T-1……st-2、st-1},将t时间点采集的历史指标数据st确定为历史指标数据序列St-1对应的真值标注。
基于历史指标数据序列St-1及所述真值标注遍st,可确定一个与t时间点对应的样本。遍历处理历史指标数据集P中的历史指标数据,可构建与不同历史时间点对应的样本,其中,每个样本包括与某个历史时间点对应的历史指标数据序列及作为该数据序列的真值标注的该历史时间点采集的历史指标数据。由所有样本组成样本集,将样本集划分为训练集及测试集,其中,划分比例可以为4:1,也可以是其它划分比例,可在后续训练神经网络过程中根据实际训练情况进行调整。
可选地,其中,在构建不同时间点的历史指标数据序列之前,所述方法还包括:
对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
其中,设备1获取到的历史指标数据集中的个别数据可能存在因偶然的异常情况导致的数据异常(偏离正常高值或正常低值),又或者连续多个数据可能存在逐个增大或减小的趋势,因此,针对历史指标数据集中可能的历史指标数据异常情况,在用于确定训练集及测试集之前,可以先对历史指标数据集进行预处理,以消除异常历史指标数据的影响。
例如,采用移动平均法对历史指标数据集P中的数据进行处理,比如,对于在历史时间点t采集的历史指标数据st,选择st前的n个历史指标数据的平均值作为对应历史时间点t的历史指标数据s’t,也可以选择st前后共n个历史指标数据的平均值作为对应历史时间点t的历史指标数据s’t,在此,对n的选择应远小于历史指标数据集中数据的个数,以免造成数据不能真实反映被监控点的实际情况,而且,对st前后n个历史指标数据的选择方式不作具体限定。按此方法遍历历史指标数据集中的所有数据,可得到由对应不同历史时刻t的新历史指标数据s’t构成的新的历史指标数据集P’,其中,新的历史指标数据集P’中的数据个数比历史指标数据集P中的数据少n个(做移动平均时选择的n个数据中不包含t时刻的数据st),或者少(n-1)个(做移动平均时选择的n个数据中包含t时刻的数据st)。基于预设周期,对新的历史指标数据集P’进行处理,以确定训练集及测试集。
继续在该实施例中,在所述步骤S13中,设备1将训练集样本中的历史指标数据序列输入神经网络进行训练,将神经网络的输出与该样本的真值标注进行比较,获取输出误差,直至输出误差符合预设阈值,然后采用测试集样本对获得的神经网络模型进行测试,若准确率符合预设阈值,则将训练后的神经网络确定为训练好的被监控点故障预测神经网络模型。
例如,设备1获取到被监控计算机的CPU占用率历史数据集P,对CPU占用率历史数据集P进行预处理,得到新的CPU占用率历史数据集P’,其中,新的CPU占用率历史数据集P’中包括不同历史时间点t对应的CPU占用率数据s’t,对新的CPU占用率历史数据集P’进行处理,获得不同历史时间点t的CPU占用率数据序列S’t-1,将s’t确定为S’t-1的真值标注,S’t-1与s’t对应组成一个样本,遍历新的CPU占用率历史数据集P’,将获得的不同历史时间点的样本组成CPU占用率训练集及测试集,其中,划分比例可以为4:1,也可以是其它划分比列,可在后续训练神经网络过程中根据实际训练情况进行调整。将CPU占用率训练集中t时间点对应的CPU占用率数据序列S’t-1输入神经网络,将网络输出与对应S’t-1的真值标注s’t比较,获得输出误差,基于不同训练样本的输出误差,获得神经网络的损失函数值,若损失函数值满足预设阈值,或者完成预设的迭代训练轮数,完成神经网络的训练,然后采用测试集中的样本遍历测试完成训练的神经网络,若准确率满足预设阈值,则确定训练好的神经网络为训练好的被监控计算机CPU占用率故障预测神经网络模型。
可选地,其中,所述神经网络是LSTM(Long Short Memory Network,长短时记忆网络)神经网络,所述LSTM神经网络的结构包括:
1个输入层;
2个LSTM隐含层;
1个全连接输出层。
一个实施例中的LSTM网络结构如下表3,
表3
Figure BDA0002665263370000101
本申请的技术方案中对所述神经网络结构不做限定,可以采用LSTM网络,也可以采用现有技术中常用的ANN(Artificial Neural Network,人工神经网络)或者CNN(Convolutional Neural Networks,卷积神经网络)等神经网络,对神经网络结构也不做特殊调整。
可选地,其中,所述输出误差包括均方误差。
例如,在上述关于被监控的CPU占用率的实施例中,将CPU占用率训练集中t时间点对应的CPU占用率数据序列S’t-1输入神经网络,将网络输出与对应S’t-1的真值标注s’t比较,获得t时间点训练样本的输出均方差,基于不同训练样本的输出均方差,获得神经网络的均方差损失函数值,若均方差损失函数值满足预设阈值,或者完成预设的迭代训练轮数,完成神经网络的训练,然后采用测试集中的样本遍历测试完成训练的神经网络,若准确率满足预设阈值,则确定训练好的神经网络为训练好的被监控计算机CPU占用率故障预测神经网络模型。
可选地,其中,所述一种用于故障预测神经网络模型的训练方法还包括:
获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
其中,设备1获取用于预测当前时间点tp的下一个时间点tp+1的指标数据序列Stp,其中,Stp中包含T+1个指标数据,包括当前时间点采集到的当前时间点的被监控点的指标数据stp,以及stp之前的一个预设周期T内的不同历史时间点的采集到的不同历史时间点的被监控点的T个历史指标数据stp-T、stp-T-1……stp-2、stp-1,其中,Stp中包含的指标数据个数与前述训练集及测试集中的历史指标数据序列包含的历史指标数据个数相同。
基于预设的预测时间长度Tf、预设周期T及采样数量N,可以确定迭代外推预测次数M,其中,所述M的计算公式如下:
M=Tf/T*N
将Stp{stp-T、stp-T-1……stp-2、stp-1、stp}输入训练好的被监控点故障预测神经网络模型,获得当前时间点tp的下一个时间点tp+1的被监控点预测指标数据stp+1,再构建时间点tp+2的指标数据序列Stp+1{st-T-1……stp-2、stp-1、stp、stp+1},输入训练好的被监控点故障预测神经网络模型,获得时间点tp+2的被监控点预测指标数据stp+2,依次进行M次迭代外推预测,可以预测获得不同时间点tp+3、tp+4……tp+M的被监控点预测指标数据stp+3、stp+4……stp+M
例如,在上述关于被监控的CPU占用率的实施例中,基于采集的历史指标数据,比如,采集间隔1小时,采集时间点分别为t1-1、t1-2……t10-23、t10-24,共240个采集时间点,对应采集到CPU占用率数据分别为D1-1、D1-2……D10-23、D10-24,共采集10天240个CPU占用率数据,构成CPU占用率历史数据集,若选择的预设周期T为24小时,则N为24,基于获得的CPU占用率历史数据集确定的每个CPU占用率历史数据序列的元素个数为25,获得的训练样本如下表4,
表4
序列 CPU占用率数据 标注真值
S<sub>2-1</sub> D<sub>1-1</sub>、D<sub>1-2</sub>......D<sub>1-23</sub>、D<sub>1-24</sub>、D<sub>2-1</sub> D<sub>2-2</sub>
S<sub>2-2</sub> D<sub>1-2</sub>、D<sub>1-3</sub>......D<sub>1-24</sub>、D<sub>2-1</sub>、D<sub>2-2</sub> D<sub>2-3</sub>
S<sub>2-3</sub> D<sub>1-3</sub>、D<sub>1-4</sub>......D<sub>2-1</sub>、D<sub>2-2</sub>、D<sub>2-3</sub> D<sub>2-4</sub>
...... ...... ......
S<sub>10-21</sub> D<sub>9-1</sub>、D<sub>9-2</sub>......D<sub>10-19</sub>、D<sub>10-20</sub>、D<sub>10-21</sub> D<sub>10-22</sub>
S<sub>10-22</sub> D<sub>9-2</sub>、D<sub>9-3</sub>......D<sub>10-20</sub>、D<sub>10-21</sub>、D<sub>10-22</sub> D<sub>10-23</sub>
S<sub>10-23</sub> D<sub>9-3</sub>、D<sub>9-4</sub>......D<sub>10-21</sub>、D<sub>10-22</sub>、D<sub>10-23</sub> D<sub>10-24</sub>
将上述样本按4∶1比例分别组成CPU占用率训练集及测试集训练LSTM神经网络后获得训练好的CPU占用率预测神经网络模型。然后将获得的序列S10-24{D9-4、D9- 5......D10-22、D10-23、D10-24}输入训练好的CPU占用率预测神经网络模型,预测获得1小时后的CPU占用率预测值D11-1,接着迭代获得序列S11-1{D9-6、D9-7......D10-24、D11-1},将S11-1输入训练好的CPU占用率预测神经网络模型,预测获得2小时后的CPU占用率预测值D11-2,若预设的预测时间长度是24小时,则经迭代外推预测24次,可以分别预测获得D11-1、D11- 2......D11-23、D11-24个CPU占用率预测值。
可选地,其中,所述一种用于故障预测神经网络模型的训练方法还包括:
将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
例如,在上述关于被监控的CPU占用率的实施例中,经24次迭代外推预测获得的24个CPU占用率,按时间顺序,分别将D11-1、D11-2......与预设阈值(比如90%)比较,确定其中第一个超过90%CPU占用率的预测值对应的时间点确定为故障时间点。
其中,还可以将每次预测得到的预测值与预设阈值比较,若符合预测值,则再迭代外推预测下一个时间点的预测值,若不符合预测值,则结束迭代外推预测。
可选地,其中,所述一种用于故障预测神经网络模型的训练方法还包括:
基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
其中,若确定故障时间点及对应的预测指标数据,可以将故障时间点及对应的预测指标数据作为告警信息或告警信息的一部分,通报给与被监控点有关的利益相关方,由利益相关方及时响应对应处理措施,比如让运维人员提前介入消除故障隐,有效预防故障异常的发生,可有效增大MTBF;或者在故障不可避免发生时立刻处理,有效减少故障处理时间,可有效减少MTTR。
图2示出根据本申请另一个方面的一种用于故障预测神经网络模型的训练设备示意图,其中,所述设备包括:
第一装置21,用于获取被监控点的历史指标数据集,其中,所述历史指标数据集是由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
第二装置22,用于基于预设周期及采样频率,对所述历史指标数据集进行处理,以确定训练集及测试集;
第三装置23,用于基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
设备1的第一装置21获取被监控点的历史指标数据集,其中,所述历史指标数据集是由在不同历史时间点采集到的所述被监控点的监控指标数据组成,第二装置22基于预设周期及采样频率,对第一装置21获取的历史指标数据集进行处理,以确定训练集及测试集,第三装置23基于第二装置22确定的训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
可选地,其中,所述一种用于故障预测神经网络模型的训练设备还包括:
第四装置24(未示出),用于对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
设备1的第四装置24对第一装置21获取的历史指标数据集进行预处理,以消除异常历史指标数据的影响,第二装置22基于预设周期及采样频率,对第四装置24预处理后的历史指标数据集进行处理,以确定训练集及测试集。
可选地,其中,所述一种用于故障预测神经网络模型的训练设备还包括:
第五装置25(未示出),用于获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
第六装置26(未示出),用于基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
第七装置27(未示出),用于将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
设备1的第五装置25获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成,第六装置26基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M,第七装置27将第五装置获取的所述当前时间点的指标数据序列输入第三装置23获得的训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
可选地,其中,所述一种用于故障预测神经网络模型的训练设备还包括:
第八装置28(未示出),用于将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
设备1的第八装置28将第七装置27获得的M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
可选地,其中,所述一种用于故障预测神经网络模型的训练设备还包括:
第九装置29(未示出),用于基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
设备1的第九装置29获取第八装置确定的故障时间点及对应的预测指标数据,将故障时间点及对应的预测指标数据确定为告警信息或告警信息的一部分,上报与被监控点有关的利益相关方,由利益相关方及时响应对应处理措施,比如让运维人员提前介入消除故障隐,有效预防故障异常的发生,可有效增大MTBF;或者在故障不可避免发生时立刻处理,有效减少故障处理时间,可有效减少MTTR。
根据本申请的又一方面,还提供了一种计算机可读介质,所述计算机可读介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述方法。
根据本申请的又一方面,还提供了一种用于故障预测神经网络模型的训练设备,其中,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:获取被监控点的历史指标数据集,对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响,基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集,基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型;获取当前时间点的指标数据序列,基于预设的预测时间长度、预设周期及采样数量,确定迭代外推预测次数M,将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据;将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点;基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (15)

1.一种用于故障预测神经网络模型的训练方法,其特征在于,所述方法包括:
获取被监控点的历史指标数据集,其中,所述历史指标数据集由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集;
基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述基于预设周期,对所述历史指标数据集进行处理,以确定训练集及测试集包括:
基于预设周期,确定采样数量N;
遍历所述历史指标数据集中的历史指标数据,构建不同时间点的历史指标数据序列,其中,所述不同时间点的历史指标数据序列是由该时间点前的N个历史指标数据组成;
将不同时间点的历史指标数据确定为该时间点对应的历史指标数据序列的真值标注;
基于所述历史指标数据序列及所述真值标注,确定所述训练集及测试集,其中,所述训练集及测试集中的样本包括不同时间点的历史指标数据序列及对应的真值标注。
3.根据权利要求2所述的方法,其特征在于,在构建不同时间点的历史指标数据序列之前,所述方法还包括:
对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述神经网络是LSTM神经网络,所述LSTM神经网络的结构包括:
1个输入层;
2个LSTM隐含层;
1个全连接输出层。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述输出误差包括均方误差。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
9.一种用于故障预测神经网络模型的训练设备,其特征在于,所述设备包括:
第一装置,用于获取被监控点的历史指标数据集,其中,所述历史指标数据集是由在不同历史时间点采集到的所述被监控点的监控指标数据组成;
第二装置,用于基于预设周期及采样频率,对所述历史指标数据集进行处理,以确定训练集及测试集;
第三装置,用于基于所述训练集训练神经网络,直至所述神经网络输出的输出误差符合第一预设阈值,基于所述测试集测试所述神经网络,若准确率符合第二预设阈值,获得训练好的被监控点故障预测神经网络模型。
10.根据权利要求9所述的设备,其特征在于,所述设备还包括:
第四装置,用于对所述历史指标数据集进行预处理,以消除异常历史指标数据的影响。
11.根据权利要求9或10所述的设备,其特征在于,所述设备还包括:
第五装置,用于获取当前时间点的指标数据序列,其中,所述当前时间点的指标数据序列由当前时间点前的N个历史指标数据组成;
第六装置,用于基于预设的预测时间长度、预设周期及采样数量N,确定迭代外推预测次数M;
第七装置,用于将所述当前时间点的指标数据序列输入所述训练好的被监控点故障预测神经网络模型,进行M次迭代外推预测,以获得M个被监控点的预测指标数据。
12.根据权利要求11所述的设备,其特征在于,所述设备还包括:
第八装置,用于将所述M个被监控点的预测指标数据按时间顺序分别于第三预设阈值比较,确定第一个不符合的被监控点的预测指标数据对应的时间点为故障时间点。
13.根据权利要求12所述的设备,其特征在于,所述设备还包括:
第九装置,用于基于所述故障时间点及对应的预测指标数据,确定告警信息,并将所述告警信息上报。
14.一种计算机可读介质,其特征在于,
其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。
15.一种设备,其特征在于,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至8中任一项所述方法的操作。
CN202010916672.2A 2020-09-03 2020-09-03 一种用于故障预测神经网络模型的训练方法与设备 Active CN112115024B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010916672.2A CN112115024B (zh) 2020-09-03 2020-09-03 一种用于故障预测神经网络模型的训练方法与设备
PCT/CN2021/090028 WO2022048168A1 (zh) 2020-09-03 2021-04-26 一种用于故障预测神经网络模型的训练方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010916672.2A CN112115024B (zh) 2020-09-03 2020-09-03 一种用于故障预测神经网络模型的训练方法与设备

Publications (2)

Publication Number Publication Date
CN112115024A true CN112115024A (zh) 2020-12-22
CN112115024B CN112115024B (zh) 2023-07-18

Family

ID=73801715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010916672.2A Active CN112115024B (zh) 2020-09-03 2020-09-03 一种用于故障预测神经网络模型的训练方法与设备

Country Status (2)

Country Link
CN (1) CN112115024B (zh)
WO (1) WO2022048168A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111585A (zh) * 2021-04-15 2021-07-13 德州欧瑞电子通信设备制造有限公司 一种智能机柜故障预测方法、系统及智能机柜
CN113452379A (zh) * 2021-07-16 2021-09-28 燕山大学 断面轮廓降维模型训练方法、系统及数据压缩方法、系统
WO2022048168A1 (zh) * 2020-09-03 2022-03-10 上海上讯信息技术股份有限公司 一种用于故障预测神经网络模型的训练方法与设备
CN114710413A (zh) * 2022-03-31 2022-07-05 中国农业银行股份有限公司 一种银行网点网络状态的预测方法及装置
CN115331155A (zh) * 2022-10-14 2022-11-11 智慧齐鲁(山东)大数据科技有限公司 一种海量视频监控点位出图状态检测方法及系统
WO2023045829A1 (zh) * 2021-09-24 2023-03-30 中兴通讯股份有限公司 一种业务异常预测方法、装置、存储介质及电子装置
CN117455666A (zh) * 2023-10-16 2024-01-26 厦门国际银行股份有限公司 一种基于神经网络的交易技术指标预测方法、装置及设备

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999182B (zh) * 2022-05-25 2023-07-04 中国人民解放军国防科技大学 基于lstm回馈机制的车流量预测方法、装置及设备
CN115001942A (zh) * 2022-05-26 2022-09-02 腾云悦智科技(深圳)有限责任公司 一种运维监控阈值推荐的方法及系统
CN115269319B (zh) * 2022-07-21 2023-09-01 河南职业技术学院 一种ceph分布式计算机故障诊断方法
CN115293057B (zh) * 2022-10-10 2022-12-20 深圳先进技术研究院 一种基于多源异构数据的风力发电机故障预测方法
CN115392056A (zh) * 2022-10-26 2022-11-25 广东电网有限责任公司中山供电局 一种高压架空输电线路运行状态监测及预警方法及装置
CN115671616B (zh) * 2022-10-28 2023-06-27 厦门海辰储能科技股份有限公司 一种用于储能集装箱的消防系统、方法及存储介质
CN115600764B (zh) * 2022-11-17 2023-05-05 中船重工(武汉)凌久高科有限公司 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法
CN116192608A (zh) * 2023-01-18 2023-05-30 北京百度网讯科技有限公司 云手机故障预测方法、装置以及设备
CN116027736B (zh) * 2023-02-14 2023-09-12 广东热浪新材料科技有限公司 一种星盆加工设备的控制优化方法及控制系统
CN116359683B (zh) * 2023-02-28 2023-12-26 四川大唐国际甘孜水电开发有限公司 一种基于信息交互的局部放电模式识别方法及系统
CN115865992B (zh) * 2023-03-02 2023-08-04 中国建材检验认证集团湖南有限公司 一种智慧水利在线监测系统
CN116304928A (zh) * 2023-03-21 2023-06-23 北京思维实创科技有限公司 供电设备故障预测方法、装置、设备及存储介质
CN116046078A (zh) * 2023-03-31 2023-05-02 东莞市楷德精密机械有限公司 一种半导体清洗设备的故障监测预警方法及系统
CN116558824B (zh) * 2023-04-19 2024-02-06 华中科技大学 一种面向多通道的轴承综合指标健康监测方法及系统
CN116248959B (zh) * 2023-05-12 2023-07-28 深圳市橙视科技发展有限公司 网络播放器故障检测方法、装置、设备及存储介质
CN116611006B (zh) * 2023-05-22 2024-02-20 广州吉谷电器有限公司 基于用户反馈的电水壶的故障识别方法及装置
CN116432542B (zh) * 2023-06-12 2023-10-20 国网江西省电力有限公司电力科学研究院 一种基于误差序列修正的开关柜母排温升预警方法及系统
CN116471196B (zh) * 2023-06-19 2023-10-20 宏景科技股份有限公司 运维监控网络维护方法、系统及设备
CN116517921B (zh) * 2023-07-03 2023-11-10 成都飞机工业(集团)有限责任公司 航空液压油车状态在线检测方法及系统
CN116934354B (zh) * 2023-07-21 2024-04-05 浙江远图技术股份有限公司 一种药品计量称的监管方法、装置、电子设备及介质
CN116861202B (zh) * 2023-09-05 2023-12-19 青岛哈尔滨工程大学创新发展中心 基于长短期记忆神经网络的船舶运动包络预报方法及系统
CN117370848B (zh) * 2023-12-08 2024-04-02 深圳市明心数智科技有限公司 设备故障预测方法、装置、计算机设备及存储介质
CN117892085A (zh) * 2024-01-15 2024-04-16 南京龟兔赛跑软件研究院有限公司 一种用于新能源自控柜运行操作演示系统及方法
CN117880055B (zh) * 2024-03-12 2024-05-31 灵长智能科技(杭州)有限公司 基于传输层指标的网络故障诊断方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697852A (zh) * 2019-01-23 2019-04-30 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法
CN110163189A (zh) * 2019-06-10 2019-08-23 哈尔滨工业大学 一种带宽受限信号动态外推方法
US20200104639A1 (en) * 2018-09-28 2020-04-02 Applied Materials, Inc. Long short-term memory anomaly detection for multi-sensor equipment monitoring

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383766B (zh) * 2016-09-09 2018-09-11 北京百度网讯科技有限公司 系统监控方法和装置
CN109117941A (zh) * 2018-07-16 2019-01-01 北京思特奇信息技术股份有限公司 告警预测方法、系统、存储介质及计算机设备
CN110008079A (zh) * 2018-12-25 2019-07-12 阿里巴巴集团控股有限公司 监控指标异常检测方法、模型训练方法、装置及设备
CN110441065B (zh) * 2019-07-04 2022-02-08 杭州华电江东热电有限公司 基于lstm的燃气轮机在线检测方法与装置
CN110865929B (zh) * 2019-11-26 2024-01-23 携程旅游信息技术(上海)有限公司 异常检测预警方法及系统
CN112115024B (zh) * 2020-09-03 2023-07-18 上海上讯信息技术股份有限公司 一种用于故障预测神经网络模型的训练方法与设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200104639A1 (en) * 2018-09-28 2020-04-02 Applied Materials, Inc. Long short-term memory anomaly detection for multi-sensor equipment monitoring
CN109697852A (zh) * 2019-01-23 2019-04-30 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法
CN110163189A (zh) * 2019-06-10 2019-08-23 哈尔滨工业大学 一种带宽受限信号动态外推方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘云等: "基于循环神经网络的通信卫星故障检测", 《计算机科学》 *
刘云等: "基于循环神经网络的通信卫星故障检测", 《计算机科学》, vol. 47, no. 02, 29 February 2020 (2020-02-29), pages 227 - 232 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048168A1 (zh) * 2020-09-03 2022-03-10 上海上讯信息技术股份有限公司 一种用于故障预测神经网络模型的训练方法与设备
CN113111585A (zh) * 2021-04-15 2021-07-13 德州欧瑞电子通信设备制造有限公司 一种智能机柜故障预测方法、系统及智能机柜
CN113452379A (zh) * 2021-07-16 2021-09-28 燕山大学 断面轮廓降维模型训练方法、系统及数据压缩方法、系统
WO2023045829A1 (zh) * 2021-09-24 2023-03-30 中兴通讯股份有限公司 一种业务异常预测方法、装置、存储介质及电子装置
CN114710413A (zh) * 2022-03-31 2022-07-05 中国农业银行股份有限公司 一种银行网点网络状态的预测方法及装置
CN115331155A (zh) * 2022-10-14 2022-11-11 智慧齐鲁(山东)大数据科技有限公司 一种海量视频监控点位出图状态检测方法及系统
CN115331155B (zh) * 2022-10-14 2023-02-03 智慧齐鲁(山东)大数据科技有限公司 一种海量视频监控点位出图状态检测方法及系统
CN117455666A (zh) * 2023-10-16 2024-01-26 厦门国际银行股份有限公司 一种基于神经网络的交易技术指标预测方法、装置及设备

Also Published As

Publication number Publication date
CN112115024B (zh) 2023-07-18
WO2022048168A1 (zh) 2022-03-10

Similar Documents

Publication Publication Date Title
CN112115024A (zh) 一种用于故障预测神经网络模型的训练方法与设备
CN111178456B (zh) 异常指标检测方法、装置、计算机设备和存储介质
CN109558295B (zh) 一种性能指标异常检测方法及装置
US9817893B2 (en) Tracking changes in user-generated textual content on social media computing platforms
US20170371757A1 (en) System monitoring method and apparatus
US20160055044A1 (en) Fault analysis method, fault analysis system, and storage medium
US8918345B2 (en) Network analysis system
US11620539B2 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
CN113037595B (zh) 异常设备检测方法、装置、电子设备及存储介质
CN106612216A (zh) 网站访问异常的检测方法及装置
CN112433896A (zh) 一种服务器磁盘故障预测方法、装置、设备及存储介质
CN111858265A (zh) 一种存储系统的存储故障预测方法、系统及装置
CN113590429A (zh) 一种服务器故障诊断方法、装置及电子设备
CN114356734A (zh) 服务异常检测方法和装置、设备、存储介质
CN112398700A (zh) 一种服务降级方法及装置、存储介质、计算机设备
CN111949496B (zh) 一种数据检测方法及装置
CN113806343B (zh) 一种车联网数据质量的评估方法和系统
CN114297037A (zh) 一种告警聚类方法及装置
CN117149565A (zh) 云平台关键性能指标的状态检测方法、装置、设备及介质
CN111783883A (zh) 一种异常数据的检测方法及装置
CN113971119B (zh) 基于无监督模型的用户行为异常分析评估方法及系统
KR20200108199A (ko) 이상 감지를 이용한 모니터링 자동화 방법 및 장치
CN111695829B (zh) 一种指标波动周期计算方法、装置、存储介质及电子设备
CN112395179B (zh) 一种模型训练方法、磁盘预测方法、装置及电子设备
CN113285978B (zh) 基于区块链和大数据的故障识别方法及通用计算节点

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Training Method and Equipment for Fault Prediction Neural Network Models

Granted publication date: 20230718

Pledgee: China Minsheng Banking Corp Shanghai branch

Pledgor: SHANGHAI SUNINFO TECHNOLOGY Co.,Ltd.

Registration number: Y2024310000433