CN107612756A - 一种具有智能故障分析处理功能的运维管理系统 - Google Patents

一种具有智能故障分析处理功能的运维管理系统 Download PDF

Info

Publication number
CN107612756A
CN107612756A CN201711053307.8A CN201711053307A CN107612756A CN 107612756 A CN107612756 A CN 107612756A CN 201711053307 A CN201711053307 A CN 201711053307A CN 107612756 A CN107612756 A CN 107612756A
Authority
CN
China
Prior art keywords
module
fault
script
time
fault restoration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711053307.8A
Other languages
English (en)
Inventor
姚小艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Yizhou Union Network Technology Co Ltd
Original Assignee
Guangxi Yizhou Union Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Yizhou Union Network Technology Co Ltd filed Critical Guangxi Yizhou Union Network Technology Co Ltd
Priority to CN201711053307.8A priority Critical patent/CN107612756A/zh
Publication of CN107612756A publication Critical patent/CN107612756A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明涉及系统运维管理技术领域,尤其是一种具有智能故障分析处理功能的运维管理系统。包括系统监测模块、故障信息识别模块、故障修复模块、故障实例数据库、脚本调用模块和算法调用模块和故障修复评估模块;系统监测模块用于监测系统的运行状态;故障信息识别模块异常情况进行判断是否为虚警;故障实例数据库用于存储系统的历史故障实例与故障特征;脚本调用模块用于存放及执行各类故障的维护脚本;算法调用模块用于存储并执行各类分类算法;故障修复模块用于对故障进行修复;故障修复评估模块用于对故障修复结果进行评估。本发明能对故障快速修复,并能自动对修复结果不理想及修复时间过长的故障提醒管理员进行优化。

Description

一种具有智能故障分析处理功能的运维管理系统
技术领域
本发明涉及系统运维管理技术领域,尤其是一种具有智能故障分析处理功能的运维管理系统。
背景技术
目前IT运维系统规模不断增长,系统在对服务器、虚拟机、交换机等网络设备性能及其网络连通性进行监测过程中,运维人员每天会收到越来越多的监控报警,面对海量的运维指标当系统出现故障时,运维人员很难从海量监控指标中迅速找到故障根因,报警风暴极大地降低了定位问题的速度,故障恢复速度基本依赖于运维人员的经验以及操作响应速度。因此建立一个故障自动诊断与快速恢复系统协同处理的智能运维平台,针对多场景构建机器学习模型与大数据专家系统,实时对运维平台的异常进行在线诊断与定位,当系统出现故障时通过执行相应策略实现快速修复,恢复正常运行是人们所需要的。
发明内容
为了克服上述问题,本发明提供一种具有智能故障分析处理功能的运维管理系统,实时对系统的异常进行在线诊断与定位,当系统出现故障时通过执行相应策略实现快速修复,并且能自动对修复结果不理想及修复时间过长的故障提醒系统管理员进行优化。
本发明解决其技术问题所采用的技术方案是:
一种具有智能故障分析处理功能的运维管理系统,包括系统监测模块、故障信息识别模块、故障修复模块、故障修复评估模块,故障实例数据库、脚本调用模块和算法调用模块;
所述系统监测模块用于监测系统的运行状态,当监测到异常时,系统监测模块将当前的状态参数及监测到的异常情况传递给故障信息收集模块;所述系统监测模块还用于采集原始日志数据并将其进行初步整理、格式化
所述故障信息识别模块用于将收集模块传递收集到的异常情况进行识别确认是否为虚警,将判断为故障的信息传递给故障修复模块进行修复;
所述故障修复模块用于在接收到故障信息识别模块的报警信息后根据故障特征对故障进行修复;
所述故障修复评估模块用于对故障修复模块的故障修复结果进行评估是否合格;所述故障修复评估模块还包括时间检测单元,所述时间检测单元用于检测故障修复花费时间并判断所花费的时间是否大于阈值;
所述故障实例数据库用于存储系统的历史故障实例与故障特征;
所述脚本调用模块用于存放及执行各类故障的维护脚本;
所述算法调用模块用于存储并执行各类分类算法、识别算法、匹配算法,供各模块进行调用计算。
进一步的,所述故障修复评估模块还用于对故障修复后,根据系统的运行状态对每次修复结果进行打分,定期将打分低的自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
进一步的,所述时间检测单元工作流程为:当故障修复模块在接收到故障信息识别模块的报警信息后,所述时间检测单元检测并记录当前系统时间,当故障修复模块将故障修复后,所述时间时间检测单元再次检测并记录当前系统时间,并计算两次所检测到的时间间隔,并判断所述时间间隔是否大于阈值,当所述时间间隔大于阈值时,将该故障自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
进一步的,所述阈值为修复该故障所需平均时间的2-3倍。
进一步的,所述报警信息识别模块接收到报警信息后,提取报警信息的特征与故障实例数据库的故障特征进行初步匹配并计算评分,当评分高于预设阈值时,则认为此为故障信息;当评分低于预设阈值时,提取脚本调用模块中的功能验证脚本执行,对业务进行持续一段时间的验证与观察如持续一段时间内,如业务与功能都正常,则认为此报警为虚警,同时,系统将此种情况存及其特征数据提交至故障实例数据库。
进一步的,所述故障修复模块对故障修复过程为:在接收到报警信息后,将接收到的故障信息与故障实例数据库的各类故障特证进行一一比对,选取若干个相似度最高的故障信息,从故障实例数据库中拉取对应的主动诊断脚本的编号,再到脚本调用模块中调用主动诊断脚本,来进一步获取诊断日志,获取到诊断日志后,与故障实例数据库的中的实例特证进行一一比对,计算契合度;当有多个契合度达标,则首先采用契合度高的方案调用执行对应的修复脚本,进行修复,修复完成后,再调用故障修复评估模块进行评估,评估达标则修复完成;如果评估不达标,则进行回退,再执行下一个契合度达标的方案。
本发明的有益效果是,本发明中的监测模块能对系统进行全面检测,当检测系统出现异常时,故障信息识别模块对异常信息进行识别判断是否为故障,对于判断为故障的信息,故障修复模块对故障进行有效修复,故障修复评估模块对故障修复模块的修复结果进行评估能针对修复结果不理想的故障提交给系统管理员进行分析,本系统还能对于修复过程中出现所需时间过长的结果提醒统管理员进行分析并进行相应的优化系统。本系统不仅能对异常进行在线诊断与定位,当系统出现故障时通过执行相应策略实现快速修复,并且能自动对修复结果不理想及修复时间过长的故障提醒系统管理员进行优化,不断提升故障修复效果及效率。
附图说明
图1是本发明一较佳实施方式的具有智能故障分析处理功能的运维管理系统结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,当组件被称为“固定于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件,它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请同时参见图1本发明一较佳实施方式提供一种具有智能故障分析处理功能的运维管理系统,包括包括系统监测模块10、故障信息识别模块20、故障修复模块30和故障修复评估模块40。系统监测模块10用于监测系统的运行状态,当监测到异常时,系统监测模块10将当前的状态参数及监测到的异常情况传递给故障信息收集模块20,系统监测模块10还用于采集原始日志数据并将其进行初步整理、格式化;故障信息识别模块20用于将收集模块传递收集到的异常情况进行识别确认是否为虚警,将判断为故障的信息传递给故障修复模块30进行修复;故障修复模30块用于在接收到故障信息识别模块的报警信息后根据故障特征对故障进行修复;故障修复评估模块40用于对故障修复模块的故障修复结果进行评估是否合格;故障修复评估模块40还包括时间检测单元410,时间检测单元410用于检测故障修复花费时间并判断所花费的时间是否大于阈值。故障实例数据库50用于存储系统的历史故障实例与故障特征;脚本调用模块60用于存放故障发生时,主动采集诊断信息的执行脚本,将输出的信息交由报警信息采集模块进行采集;算法调用模块用于存储并执行各类分类算法、识别算法、匹配算法,供各模块进行调用计算。
进一步的,故障修复评估模块40还用于对故障修复后,根据系统的运行状态对每次修复结果进行打分,定期将打分低的自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
进一步的,时间检测单元410工作流程为:当故障修复模块30在接收到故障信息识别模20块的报警信息后,时间检测单元410检测并记录当前系统时间,当故障修复模块30将故障修复后,时间时间检测单元410再次检测并记录当前系统时间,并计算两次所检测到的时间间隔,并判断所述时间间隔是否大于阈值,当所述时间间隔大于阈值时,将该故障自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。所述阈值为修复该故障所需平均时间的2-3倍。
进一步的,报警信息识别模块20接收到报警信息后,提取报警信息的特征与故障实例数据库50的故障特征进行初步匹配并计算评分,当评分高于预设阈值时,则认为此为故障信息;当评分低于预设阈值时,提取脚本调用模块60中的功能验证脚本执行,对业务进行持续一段时间的验证与观察如持续一段时间内,如业务与功能都正常,则认为此报警为虚警,同时,系统将此种情况存及其特征数据提交至故障实例数据库50。
进一步的,故障修复模块40对故障修复过程为:在接收到报警信息后,将接收到的故障信息与故障实例数据库50各类故障特证进行一一比对,选取若干个相似度最高的故障信息,从故障实例数据库中拉取对应的主动诊断脚本的编号,再到脚本调用模块中调用主动诊断脚本,来进一步获取诊断日志,获取到诊断日志后,与故障实例数据库的中的实例特证进行一一比对,计算契合度;当有多个契合度达标,则首先采用契合度高的方案调用执行对应的修复脚本,进行修复,修复完成后,再调用故障修复评估模块40进行评估,评估达标则修复完成;如果评估不达标,则进行回退,再执行下一个契合度达标的方案。

Claims (6)

1.一种具有智能故障分析处理功能的运维管理系统,其特征在于:包括系统监测模块、故障信息识别模块、故障修复模块、故障修复评估模块、故障实例数据库、脚本调用模块和算法调用模块;
所述系统监测模块用于监测系统的运行状态,当监测到异常时,系统监测模块将当前的状态参数及监测到的异常情况传递给故障信息收集模块;所述系统监测模块还用于采集原始日志数据并将其进行初步整理、格式化;
所述故障信息识别模块用于将收集模块传递收集到的异常情况进行识别确认是否为虚警,将判断为故障的信息传递给故障修复模块进行修复;
所述故障修复模块用于在接收到故障信息识别模块的报警信息后根据故障特征对故障进行修复;
所述故障修复评估模块用于对故障修复模块的故障修复结果进行评估是否合格;所述故障修复评估模块还包括时间检测单元,所述时间检测单元用于检测故障修复花费时间并判断所花费的时间是否大于阈值;
所述故障实例数据库用于存储系统的历史故障实例与故障特征;
所述脚本调用模块用于存放及执行各类故障的维护脚本;
所述算法调用模块用于存储并执行各类分类算法、识别算法、匹配算法,供各模块进行调用计算。
2.根据权利要求1所述具有智能故障分析处理功能的运维管理系统,其特征在于:所述故障修复评估模块还用于对故障修复后,根据系统的运行状态对每次修复结果进行打分,定期将打分低的自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
3.根据权利要求1所述具有智能故障分析处理功能的运维管理系统,其特征在于:所述时间检测单元工作流程为:当故障修复模块在接收到故障信息识别模块的报警信息后,所述时间检测单元检测并记录当前系统时间,当故障修复模块将故障修复后,所述时间时间检测单元再次检测并记录当前系统时间,并计算两次所检测到的时间间隔,并判断所述时间间隔是否大于阈值,当所述时间间隔大于阈值时,将该故障自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
4.根据权利要求3所述具有智能故障分析处理功能的运维管理系统,其特征在于:所述阈值为修复该故障所需平均时间的2-3倍。
5.根据权利要求1所述具有智能故障分析处理功能的运维管理系统,其特征在于:所述报警信息识别模块接收到报警信息后,提取报警信息的特征与故障实例数据库的故障特征进行初步匹配并计算评分,当评分高于预设阈值时,则认为此为故障信息;当评分低于预设阈值时,提取脚本调用模块中的功能验证脚本执行,对业务进行持续一段时间的验证与观察如持续一段时间内,如业务与功能都正常,则认为此报警为虚警,同时,系统将此种情况存及其特征数据提交至故障实例数据库。
6.根据权利要求1所述具有智能故障分析处理功能的运维管理系统,其特征在于:所述故障修复模块对故障修复过程为:在接收到报警信息后,将接收到的故障信息与故障实例数据库的各类故障特证进行一一比对,选取若干个相似度最高的故障信息,从故障实例数据库中拉取对应的主动诊断脚本的编号,再到脚本调用模块中调用主动诊断脚本,来进一步获取诊断日志,获取到诊断日志后,与故障实例数据库的中的实例特证进行一一比对,计算契合度;当有多个契合度达标,则首先采用契合度高的方案调用执行对应的修复脚本,进行修复,修复完成后,再调用故障修复评估模块进行评估,评估达标则修复完成;如果评估不达标,则进行回退,再执行下一个契合度达标的方案。
CN201711053307.8A 2017-10-31 2017-10-31 一种具有智能故障分析处理功能的运维管理系统 Pending CN107612756A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711053307.8A CN107612756A (zh) 2017-10-31 2017-10-31 一种具有智能故障分析处理功能的运维管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711053307.8A CN107612756A (zh) 2017-10-31 2017-10-31 一种具有智能故障分析处理功能的运维管理系统

Publications (1)

Publication Number Publication Date
CN107612756A true CN107612756A (zh) 2018-01-19

Family

ID=61084575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711053307.8A Pending CN107612756A (zh) 2017-10-31 2017-10-31 一种具有智能故障分析处理功能的运维管理系统

Country Status (1)

Country Link
CN (1) CN107612756A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319240A (zh) * 2018-01-24 2018-07-24 中国电力科学研究院有限公司 一种在现场作业终端应用采集运维知识库的方法和系统
CN108491422A (zh) * 2018-02-07 2018-09-04 平安健康互联网股份有限公司 数据库自动化运维管理方法、服务器及存储介质
CN108599977A (zh) * 2018-02-13 2018-09-28 南京途牛科技有限公司 基于统计方法监控系统可用性的系统及方法
CN109165138A (zh) * 2018-08-01 2019-01-08 网宿科技股份有限公司 一种监控设备故障的方法和装置
CN109669844A (zh) * 2018-11-27 2019-04-23 平安科技(深圳)有限公司 设备故障处理方法、装置、设备和存储介质
CN109720814A (zh) * 2019-01-08 2019-05-07 四川省自贡运输机械集团股份有限公司 一种带式输送机远程故障监测与诊断系统
CN109992963A (zh) * 2019-04-12 2019-07-09 长沙理工大学 一种电力终端及其嵌入式系统的信息安全防护方法与体系
CN110146316A (zh) * 2019-04-10 2019-08-20 广州瑞松北斗汽车装备有限公司 汽车生产线功能柜的故障诊断方法及系统
CN110457183A (zh) * 2018-05-07 2019-11-15 中移(苏州)软件技术有限公司 一种日志处理方法及装置
CN110716840A (zh) * 2019-09-12 2020-01-21 武汉儒松科技有限公司 信息资源集中的it运维管理方法、装置、设备及介质
CN111162944A (zh) * 2019-12-26 2020-05-15 广东星舆科技有限公司 一种管理平台对接收机故障自动诊断并修复的方法及系统
WO2020119369A1 (zh) * 2018-12-13 2020-06-18 平安普惠企业管理有限公司 智能it运维故障定位方法、装置、设备及可读存储介质
CN111756778A (zh) * 2019-03-26 2020-10-09 京东数字科技控股有限公司 一种服务器磁盘清理脚本推送的方法、装置和存储介质
CN111858176A (zh) * 2020-07-22 2020-10-30 欧冶云商股份有限公司 一种远程监控故障自愈系统和方法
CN112732520A (zh) * 2020-12-30 2021-04-30 中国人民解放军32181部队 一种装备运行监控软件的故障处理方法及系统
CN113283620A (zh) * 2021-06-29 2021-08-20 中国平安人寿保险股份有限公司 基于人工智能的运维方法、装置、设备及存储介质
CN110825768B (zh) * 2019-10-10 2021-10-29 安徽康佳电子有限公司 一种基于云分析的远程电视异常处理方法及系统
CN113671286A (zh) * 2021-08-09 2021-11-19 国网河北省电力有限公司检修分公司 一种智能站继电保护自动装置安全措施执行与测试系统及方法
CN113836044A (zh) * 2021-11-26 2021-12-24 华中科技大学 一种软件故障采集和分析的方法及系统
CN114007846A (zh) * 2019-06-13 2022-02-01 录象射流技术公司 用于以改进的线路恢复时间标记基底的系统和方法
CN114710391A (zh) * 2022-03-22 2022-07-05 中国电子科技集团公司第五十四研究所 一种适用于专用通信系统的智能化故障感知分析处理方法
CN115118576A (zh) * 2022-06-23 2022-09-27 四川虹美智能科技有限公司 一种基于云端动态检测智能设备故障的方法
EP4221004A4 (en) * 2020-10-20 2024-02-21 Huawei Tech Co Ltd METHOD, APPARATUS AND SYSTEM FOR DETERMINING A FAULT RECOVERY PLAN AND COMPUTER STORAGE MEDIUM

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038373A (zh) * 2014-05-30 2014-09-10 国家电网公司 信息预警与自修复系统及方法
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
CN105550100A (zh) * 2015-12-11 2016-05-04 国家电网公司 一种信息系统故障自动恢复的方法及系统
CN106204330A (zh) * 2016-07-18 2016-12-07 国网山东省电力公司济南市历城区供电公司 一种配电网智能诊断系统
CN106209428A (zh) * 2016-06-28 2016-12-07 武汉合创源科技有限公司 一种网站故障监控预警方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038373A (zh) * 2014-05-30 2014-09-10 国家电网公司 信息预警与自修复系统及方法
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
CN105550100A (zh) * 2015-12-11 2016-05-04 国家电网公司 一种信息系统故障自动恢复的方法及系统
CN106209428A (zh) * 2016-06-28 2016-12-07 武汉合创源科技有限公司 一种网站故障监控预警方法及系统
CN106204330A (zh) * 2016-07-18 2016-12-07 国网山东省电力公司济南市历城区供电公司 一种配电网智能诊断系统

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319240B (zh) * 2018-01-24 2020-11-17 中国电力科学研究院有限公司 一种在现场作业终端应用采集运维知识库的方法和系统
CN108319240A (zh) * 2018-01-24 2018-07-24 中国电力科学研究院有限公司 一种在现场作业终端应用采集运维知识库的方法和系统
CN108491422B (zh) * 2018-02-07 2024-02-09 平安健康互联网股份有限公司 数据库自动化运维管理方法、服务器及存储介质
CN108491422A (zh) * 2018-02-07 2018-09-04 平安健康互联网股份有限公司 数据库自动化运维管理方法、服务器及存储介质
CN108599977A (zh) * 2018-02-13 2018-09-28 南京途牛科技有限公司 基于统计方法监控系统可用性的系统及方法
CN110457183A (zh) * 2018-05-07 2019-11-15 中移(苏州)软件技术有限公司 一种日志处理方法及装置
CN109165138A (zh) * 2018-08-01 2019-01-08 网宿科技股份有限公司 一种监控设备故障的方法和装置
CN109165138B (zh) * 2018-08-01 2022-06-17 网宿科技股份有限公司 一种监控设备故障的方法和装置
CN109669844A (zh) * 2018-11-27 2019-04-23 平安科技(深圳)有限公司 设备故障处理方法、装置、设备和存储介质
CN109669844B (zh) * 2018-11-27 2022-08-23 平安科技(深圳)有限公司 设备故障处理方法、装置、设备和存储介质
WO2020119369A1 (zh) * 2018-12-13 2020-06-18 平安普惠企业管理有限公司 智能it运维故障定位方法、装置、设备及可读存储介质
CN109720814A (zh) * 2019-01-08 2019-05-07 四川省自贡运输机械集团股份有限公司 一种带式输送机远程故障监测与诊断系统
CN109720814B (zh) * 2019-01-08 2020-11-24 四川省自贡运输机械集团股份有限公司 一种带式输送机远程故障监测与诊断系统
CN111756778A (zh) * 2019-03-26 2020-10-09 京东数字科技控股有限公司 一种服务器磁盘清理脚本推送的方法、装置和存储介质
CN110146316A (zh) * 2019-04-10 2019-08-20 广州瑞松北斗汽车装备有限公司 汽车生产线功能柜的故障诊断方法及系统
CN109992963A (zh) * 2019-04-12 2019-07-09 长沙理工大学 一种电力终端及其嵌入式系统的信息安全防护方法与体系
CN109992963B (zh) * 2019-04-12 2023-02-17 长沙理工大学 一种电力终端及其嵌入式系统的信息安全防护方法与体系
CN114007846A (zh) * 2019-06-13 2022-02-01 录象射流技术公司 用于以改进的线路恢复时间标记基底的系统和方法
CN110716840A (zh) * 2019-09-12 2020-01-21 武汉儒松科技有限公司 信息资源集中的it运维管理方法、装置、设备及介质
CN110825768B (zh) * 2019-10-10 2021-10-29 安徽康佳电子有限公司 一种基于云分析的远程电视异常处理方法及系统
CN111162944A (zh) * 2019-12-26 2020-05-15 广东星舆科技有限公司 一种管理平台对接收机故障自动诊断并修复的方法及系统
CN111858176A (zh) * 2020-07-22 2020-10-30 欧冶云商股份有限公司 一种远程监控故障自愈系统和方法
EP4221004A4 (en) * 2020-10-20 2024-02-21 Huawei Tech Co Ltd METHOD, APPARATUS AND SYSTEM FOR DETERMINING A FAULT RECOVERY PLAN AND COMPUTER STORAGE MEDIUM
CN112732520A (zh) * 2020-12-30 2021-04-30 中国人民解放军32181部队 一种装备运行监控软件的故障处理方法及系统
CN112732520B (zh) * 2020-12-30 2024-04-12 中国人民解放军32181部队 一种装备运行监控软件的故障处理方法及系统
CN113283620A (zh) * 2021-06-29 2021-08-20 中国平安人寿保险股份有限公司 基于人工智能的运维方法、装置、设备及存储介质
CN113671286A (zh) * 2021-08-09 2021-11-19 国网河北省电力有限公司检修分公司 一种智能站继电保护自动装置安全措施执行与测试系统及方法
CN113836044A (zh) * 2021-11-26 2021-12-24 华中科技大学 一种软件故障采集和分析的方法及系统
CN114710391A (zh) * 2022-03-22 2022-07-05 中国电子科技集团公司第五十四研究所 一种适用于专用通信系统的智能化故障感知分析处理方法
CN115118576A (zh) * 2022-06-23 2022-09-27 四川虹美智能科技有限公司 一种基于云端动态检测智能设备故障的方法

Similar Documents

Publication Publication Date Title
CN107612756A (zh) 一种具有智能故障分析处理功能的运维管理系统
CN107862393A (zh) 一种it运维管理系统
KR101856543B1 (ko) 인공지능 기반의 장애 예측 시스템
CN111209131A (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN106199276B (zh) 一种用电信息采集系统中异常信息的智能诊断系统及方法
CN105337765A (zh) 一种分布式hadoop集群故障自动诊断修复系统
CN109343395A (zh) 一种核电厂dcs操作日志的异常检测系统和方法
CN106646030A (zh) 基于多数据源及专家规则库的电网故障诊断方法及装置
CN113282635A (zh) 一种微服务系统故障根因定位方法及装置
CN107527134A (zh) 一种基于大数据的配电变压器状态评估方法及装置
CN112269812A (zh) 一种基于大数据的智能电力配电网安全监测管理系统
CN107846314A (zh) 一种智能运维管理系统
CN112434826A (zh) 一种充电桩充电设施运维故障智能分析与预警系统
CN106411617A (zh) 电力通信网络故障告警关联处理方法
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN106897779A (zh) 一种数据中心运维系统事件的处理方法
CN112650200A (zh) 一种设备故障的诊断方法及诊断装置
CN115865649A (zh) 一种智能运维管理控制方法、系统和存储介质
CN115794588A (zh) 内存故障预测方法、装置、系统及监测服务器
CN206977446U (zh) 一种变电站运维平台故障自动诊断与快速恢复系统
CN114676791A (zh) 一种基于模糊证据推理的电力系统告警信息处理方法
CN114816917A (zh) 监测数据处理方法、装置、设备及存储介质
CN107563528A (zh) 一种加强ems系统防御与快速愈合的智能运维系统
CN103870349B (zh) 用于数据处理系统的配置管理装置及方法
CN117391675B (zh) 一种数据中心基础设施运维管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180119