CN105323113A - 一种基于可视化技术的系统故障应急处置系统及方法 - Google Patents

一种基于可视化技术的系统故障应急处置系统及方法 Download PDF

Info

Publication number
CN105323113A
CN105323113A CN201510801180.8A CN201510801180A CN105323113A CN 105323113 A CN105323113 A CN 105323113A CN 201510801180 A CN201510801180 A CN 201510801180A CN 105323113 A CN105323113 A CN 105323113A
Authority
CN
China
Prior art keywords
monitoring
information
server
network
sma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510801180.8A
Other languages
English (en)
Other versions
CN105323113B (zh
Inventor
梁良
程明
吴琪
易璐
江虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510801180.8A priority Critical patent/CN105323113B/zh
Publication of CN105323113A publication Critical patent/CN105323113A/zh
Application granted granted Critical
Publication of CN105323113B publication Critical patent/CN105323113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于可视化技术的系统故障应急处置系统及方法,包括基于智能代理的分布式监控模块、基于SNMP协议的网络监控模块、基于智能代理的主机故障诊断模块、图形化告警模块、故障应急处置模块。本发明以图形化的方式告警指示不同故障类型和应急处置,将对信息应用系统重启等繁琐的维护管理命令操作封装于可被智能代理调用执行的服务器脚本程序中,实现一键式安全复位,解决了夜间调度员值班对信息应用系统故障的应急处置难题,提升了信息应用系统安全可靠运行保障能力。

Description

一种基于可视化技术的系统故障应急处置系统及方法
技术领域
本发明涉及信息系统运维管理领域,特别是涉及一种基于可视化技术的系统故障应急处置系统及方法。
背景技术
随着国网公司信息化建设的不断推进,信息系统的种类和数量不断增加,信息系统安全可靠运行要求不断提高,国网公司统一建设了IMS系统加强对信息系统运行情况的集中监控能力。为了进一步提升信息应用的可靠运行和运维管理水平,提高信息系统安全可靠运行保障能力,有必要结合公司信息调运体系的实际情况,积极研究和应用信息技术对现有信息应用的运行监控分析与应急处置机制进行创新改进。
国内外研究水平综述:
1)国外研究水平:
数据中心是一整套复杂的设施,它不仅仅包括信息系统和其它与之配套的服务器、通信、存储等设备,还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置。如图1所示,针对常见的监控需求,通过基本的监控方法,并不能达到最理想的监控效果。
信息系统运维监控对象主要包括主机和网络,主机监控可以分为应用层监控、服务层监控、服务器层监控和网络接口层监控。信息系统网络其实就是不同设备的集合,路由器、交换机、防火墙等可以视为特殊的“服务器”,而它们之间的联系组成了网络。因此,网络监控对象其实就是基于网络环境的设备。
目前,国外主流商用IT监控工具产品包括IBMTivoli、HPOpenView、MicrosoftSCCM、BMCPatrol、CAUnicenter等,商用产品价格比较昂贵,一般在几十万至数百万,且功能不易定制扩展。开源的IT监控技术包括Cacti、Nagios、Zenoss、Zabbix、HypericHQ等,以免费的形式提供,能有效监控Windows、Linux和Unix的主机状态,交换机、路由器等网络设备等,可以支持WMI、PerfMon、SNMP、JMX、HTTP、Telnet、SSH、Syslog、ICMP、FTP、SMTP等协议,但是一般缺乏友好的用户界面。
2)国内研究水平
近年来,国内在IT监控理论与技术研究领域发展很快,基于上述开源的IT监控技术,国产商用IT监控工具产品及解决方案得到快速发展,比较成熟的产品包括北塔、东华、神州泰岳、摩卡、泰豪等公司的IT运维监控管理系统。
现有的信息应用系统故障检测和处置方法需要运维人员赶赴现场,通过专业操作才能排除故障。对于夜间只有调度员值守的情况,当信息应用系统突发重大故障时,运维人员需要一定的时间才能到达现场排除故障,而在这段时间内信息应用系统将一直处于故障状态。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于可视化技术的系统故障应急处置系统及方法,当系统发生故障时,以图形化的方式告警指示不同故障类型和应急处置,基于部署于服务器中的智能代理,将对信息应用系统重启等繁琐的维护管理命令操作封装于可被智能代理调用执行的服务器脚本程序中,实现故障信息应用系统的一键式安全复位,解决夜间调度员值班对信息应用系统故障的应急处置难题,提升信息应用系统安全可靠运行保障能力。
本发明的目的是通过以下技术方案来实现的:一种基于可视化技术的系统故障应急处置系统,包括基于智能代理的分布式监控模块、基于SNMP协议的网络监控模块、基于智能代理的主机故障诊断模块、图形化告警模块;故障应急处置模块;
所述基于智能代理的分布式监控模块包括智能监控代理SMA、监控服务端,用于监控服务器的工作状态信息及运行状态;
所述基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备;
所述基于智能代理的主机故障诊断模块用于服务器故障的诊断分析;
所述图形化告警模块用于当系统发生故障时,以图形化的方式告警指示不同故障类型;
所述故障应急处置模块用于当系统发生故障时进行应急处置,实现故障信息系统的一键式安全复位。
一种系统故障应急处置的方法,包括以下步骤:
S1:运行基于智能代理的分布式监控模块;
基于分布式监控结构,在每台集群服务器上安装智能监控代理SMA,智能监控代理SMA收集服务器的工作状态信息,在监控主服务器上安装运行监控服务端;
智能监控代理SMA与监控服务端之间通过XML格式传递监控数据,监控服务端定期轮巡智能监控代理SMA获取监控信息,监控主服务器使用心跳探测检测集群内任意服务器的运行状态;
S2:运行基于SNMP协议的网络监控模块;
基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备,在网络正常工作时,基于SNMP协议的网络监控模块实现统计、配置和测试功能;在网络故障时,基于SNMP协议的网络监控模块实现各种差错监测和恢复功能;
S3:运行基于智能代理的主机故障诊断模块;
将智能监控代理SMA部署于受控主机服务器的操作系统中;智能监控代理SMA通过网络与监控主服务器建立心跳连接;根据策略对受控主机服务器主机的运行状态进行实时监控,当服务器硬件故障、网络中断或者关键进程运行异常时,智能监控代理SMA执行相应的策略动作;
监控主服务器接收到智能监控代理SMA发送的告警或故障消息后,或者智能监控代理SMA心跳连接超时后,监控主服务器将判断该受控主机发生故障;
S4:运行图形化告警模块和故障应急处置模块;
当系统发生故障时,以图形化的方式告警指示不同故障类型和应急处置,基于部署于服务器中的智能监控代理SMA,将繁琐的维护管理命令操作封装于可被智能监控代理SMA调用执行的服务器脚本程序中,实现故障信息应用系统的一键式安全复位。
优选的,所述的受控主机服务器主机包括物理机或虚拟机。
优选的,所述图形化告警模块的实现方法为:运行信息按照不同的分类以不同的形式显示在一个以运行时间信息为横坐标,以各故障运行状态信息为纵坐标的坐标系内;将各故障运行状态信息以色条和文字标签组合的形式显示在坐标系的横坐标轴的上方;将操作标识信息、告警级别信息以文字标签的形式显示在各故障运行状态信息的上方;将运行时间信息以文字标签的形式显示在坐标系的横坐标轴的下方;将各故障运行状态信息以折线的形式显示在坐标系内。
优选的,步骤S4还包括:
S41:根据系统故障信息获取各服务器、存储设备、受管交换机、路由器节点的标识信息;
S42:根据标识信息,获取各服务器、存储设备、受管交换机、路由器节点的运行状态信息,运行信息用于诊断故障;
S43:根据运行状态信息,生成信息应用系统的图形化多维度显示信息。
优选的,所述图形化多维度显示信息包括:网络接口层显示信息、服务器层显示信息、服务层显示信息和应用层显示信息。
优选的,所述网络接口层显示信息指主机网络状态数据,包括以下至少一种数据:IP地址、MAC地址、路由表、端口存活状态、上下行流量;
所述服务器层显示信息指主机BIOS与操作系统状态数据,包括以下至少一种数据:CPU负载、内存占用率、进程状态、磁盘I/O;
所述服务层显示信息包括中间件、数据库平台软件的状态数据;
所述应用层显示信息包括信息应用系统的可用性、性能状态数据;
优选的,图形化多维度显示信息还包括信息应用系统中各服务器、存储设备、受管交换机、路由器节点的操作和告警详细日志信息。
附图说明
图1为现有技术中监控需求、监控方法与监控效果对比图;
图2为本发明一种基于可视化技术的系统故障应急处置系统的结构示意图;
图3为本发明一种基于可视化技术的系统故障应急处置方法的流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
图1为现有技术中监控需求、监控方法与监控效果对比图,可以看出现有技术已难以满足信息系统高效运维监控的需要。
如图2、图3所示,本发明提出一种基于可视化技术的系统故障应急处置系统,包括基于智能代理的分布式监控模块、基于SNMP协议的网络监控模块、基于智能代理的主机故障诊断模块、图形化告警模块;故障应急处置模块;
所述基于智能代理的分布式监控模块包括智能监控代理SMA、监控服务端,用于监控服务器的工作状态信息及运行状态;
所述基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备;
所述基于智能代理的主机故障诊断模块用于服务器故障的诊断分析;
所述图形化告警模块用于当系统发生故障时,以图形化的方式告警指示不同故障类型;
所述故障应急处置模块用于当系统发生故障时进行应急处置,实现故障信息系统的一键式安全复位。
一种系统故障应急处置的方法,包括以下步骤:
S1:运行基于智能代理的分布式监控模块;
基于分布式监控结构,在每台集群服务器上安装智能监控代理SMA,智能监控代理SMA收集服务器的工作状态信息,在监控主服务器上安装运行监控服务端;
智能监控代理SMA与监控服务端之间通过XML格式传递监控数据,监控服务端定期轮巡智能监控代理SMA获取监控信息,监控主服务器使用心跳探测检测集群内任意服务器的运行状态;
S2:运行基于SNMP协议的网络监控模块;
基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备,在网络正常工作时,基于SNMP协议的网络监控模块实现统计、配置和测试功能;在网络故障时,基于SNMP协议的网络监控模块实现各种差错监测和恢复功能;
S3:运行基于智能代理的主机故障诊断模块;
将智能监控代理SMA部署于受控主机服务器的操作系统中;智能监控代理SMA通过网络与监控主服务器建立心跳连接;根据策略对受控主机服务器主机的运行状态进行实时监控,当服务器硬件故障、网络中断或者关键进程运行异常时,智能监控代理SMA执行相应的策略动作;
监控主服务器接收到智能监控代理SMA发送的告警或故障消息后,或者智能监控代理SMA心跳连接超时后,监控主服务器将判断该受控主机发生故障;
S4:运行图形化告警模块和故障应急处置模块;
当系统发生故障时,以图形化的方式告警指示不同故障类型和应急处置,基于部署于服务器中的智能监控代理SMA,将繁琐的维护管理命令操作封装于可被智能监控代理SMA调用执行的服务器脚本程序中,实现故障信息应用系统的一键式安全复位。
优选的,所述的受控主机服务器主机包括物理机或虚拟机。
优选的,所述图形化告警模块的实现方法为:运行信息按照不同的分类以不同的形式显示在一个以运行时间信息为横坐标,以各故障运行状态信息为纵坐标的坐标系内;将各故障运行状态信息以色条和文字标签组合的形式显示在坐标系的横坐标轴的上方;将操作标识信息、告警级别信息以文字标签的形式显示在各故障运行状态信息的上方;将运行时间信息以文字标签的形式显示在坐标系的横坐标轴的下方;将各故障运行状态信息以折线的形式显示在坐标系内。
优选的,步骤S4还包括:
S41:根据系统故障信息获取各服务器、存储设备、受管交换机、路由器节点的标识信息;
S42:根据标识信息,获取各服务器、存储设备、受管交换机、路由器节点的运行状态信息,运行信息用于诊断故障;
S43:根据运行状态信息,生成信息应用系统的图形化多维度显示信息。
优选的,所述图形化多维度显示信息包括:网络接口层显示信息、服务器层显示信息、服务层显示信息和应用层显示信息。
优选的,所述网络接口层显示信息指主机网络状态数据,包括以下至少一种数据:IP地址、MAC地址、路由表、端口存活状态、上下行流量;
所述服务器层显示信息指主机BIOS与操作系统状态数据,包括以下至少一种数据:CPU负载、内存占用率、进程状态、磁盘I/O;
所述服务层显示信息包括中间件、数据库平台软件的状态数据;
所述应用层显示信息包括信息应用系统的可用性、性能状态数据;
优选的,图形化多维度显示信息还包括信息应用系统中各服务器、存储设备、受管交换机、路由器节点的操作和告警详细日志信息。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (8)

1.一种基于可视化技术的系统故障应急处置系统,其特征在于:包括基于智能代理的分布式监控模块、基于SNMP协议的网络监控模块、基于智能代理的主机故障诊断模块、图形化告警模块、故障应急处置模块;
所述基于智能代理的分布式监控模块用于监控服务器的工作状态信息及运行状态;
所述基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备;
所述基于智能代理的主机故障诊断模块用于服务器故障的诊断分析;
所述图形化告警模块用于当系统发生故障时,以图形化的方式告警指示不同故障类型;
所述故障应急处置模块用于当系统发生故障时进行应急处置,实现故障信息系统的一键式安全复位。
2.一种应用权利要求1所述系统进行系统故障应急处置的方法,其特征在于,包括以下步骤:
S1:运行基于智能代理的分布式监控模块;
基于分布式监控结构,在每台集群服务器上安装智能监控代理SMA,智能监控代理SMA收集服务器的工作状态信息,在监控主服务器上安装运行监控服务端;
智能监控代理SMA与监控服务端之间通过XML格式传递监控数据,监控服务端定期轮巡智能监控代理SMA获取监控信息,监控主服务器使用心跳探测检测集群内任意服务器的运行状态;
S2:运行基于SNMP协议的网络监控模块;
基于SNMP协议的网络监控模块用于监视网络性能、检测分析网络差错和配置网络设备,在网络正常工作时,基于SNMP协议的网络监控模块实现统计、配置和测试功能;在网络故障时,基于SNMP协议的网络监控模块实现各种差错监测和恢复功能;
S3:运行基于智能代理的主机故障诊断模块;
将智能监控代理SMA部署于受控主机服务器的操作系统中;智能监控代理SMA通过网络与监控主服务器建立心跳连接;根据策略对受控主机服务器主机的运行状态进行实时监控,当服务器硬件故障、网络中断或者关键进程运行异常时,智能监控代理SMA执行相应的策略动作;
监控主服务器接收到智能监控代理SMA发送的告警或故障消息后,或者智能监控代理SMA心跳连接超时后,监控主服务器将判断该受控主机发生故障;
S4:运行图形化告警模块和故障应急处置模块;
当系统发生故障时,以图形化的方式告警指示不同故障类型和应急处置,基于部署于服务器中的智能监控代理SMA,将繁琐的维护管理命令操作封装于可被智能监控代理SMA调用执行的服务器脚本程序中,实现故障信息应用系统的一键式安全复位。
3.根据权利要求2所述的方法,其特征在于:所述的受控主机服务器主机包括物理机或虚拟机。
4.根据权利要求2所述的方法,其特征在于,所述图形化告警模块的实现方法为:运行信息按照不同的分类以不同的形式显示在一个以运行时间信息为横坐标,以各故障运行状态信息为纵坐标的坐标系内;将各故障运行状态信息以色条和文字标签组合的形式显示在坐标系的横坐标轴的上方;将操作标识信息、告警级别信息以文字标签的形式显示在各故障运行状态信息的上方;将运行时间信息以文字标签的形式显示在坐标系的横坐标轴的下方;将各故障运行状态信息以折线的形式显示在坐标系内。
5.根据权利要求2所述的方法,其特征在于步骤S4还包括:
S41:根据系统故障信息获取各服务器、存储设备、受管交换机、路由器节点的标识信息;
S42:根据标识信息,获取各服务器、存储设备、受管交换机、路由器节点的运行状态信息,运行信息用于诊断故障;
S43:根据运行状态信息,生成信息应用系统的图形化多维度显示信息。
6.根据权利要求5所述的方法,其特征在于,所述图形化多维度显示信息包括:网络接口层显示信息、服务器层显示信息、服务层显示信息和应用层显示信息。
7.根据权利要求6所述的方法,其特征在于,所述网络接口层显示信息指主机网络状态数据,包括以下至少一种数据:IP地址、MAC地址、路由表、端口存活状态、上下行流量;
所述服务器层显示信息指主机BIOS与操作系统状态数据,包括以下至少一种数据:CPU负载、内存占用率、进程状态、磁盘I/O;
所述服务层显示信息包括中间件、数据库平台软件的状态数据;
所述应用层显示信息包括信息应用系统的可用性、性能状态数据。
8.根据权利要求6所述的方法,其特征在于,图形化多维度显示信息还包括信息应用系统中各服务器、存储设备、受管交换机、路由器节点的操作和告警详细日志信息。
CN201510801180.8A 2015-11-19 2015-11-19 一种基于可视化技术的系统故障应急处置方法 Active CN105323113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510801180.8A CN105323113B (zh) 2015-11-19 2015-11-19 一种基于可视化技术的系统故障应急处置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510801180.8A CN105323113B (zh) 2015-11-19 2015-11-19 一种基于可视化技术的系统故障应急处置方法

Publications (2)

Publication Number Publication Date
CN105323113A true CN105323113A (zh) 2016-02-10
CN105323113B CN105323113B (zh) 2019-01-18

Family

ID=55249755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510801180.8A Active CN105323113B (zh) 2015-11-19 2015-11-19 一种基于可视化技术的系统故障应急处置方法

Country Status (1)

Country Link
CN (1) CN105323113B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407081A (zh) * 2016-09-30 2017-02-15 郑州云海信息技术有限公司 一种机箱管理系统及服务器
CN106650417A (zh) * 2016-12-13 2017-05-10 广东电网有限责任公司电力科学研究院 一种基于系统告警机制的应用自保护工作模型
CN106789239A (zh) * 2016-12-21 2017-05-31 国网江西省电力公司信息通信分公司 面向电力业务的信息应用系统故障趋势预测方法及装置
CN106779221A (zh) * 2016-12-21 2017-05-31 国网江西省电力公司信息通信分公司 面向电力业务的信息应用系统故障趋势信息获取方法
CN107273272A (zh) * 2017-06-22 2017-10-20 郑州云海信息技术有限公司 一种热插拔设备的监控方法及装置
CN107395651A (zh) * 2017-09-07 2017-11-24 赛尔网络有限公司 服务系统及信息处理方法
CN109271294A (zh) * 2018-09-18 2019-01-25 安徽华博胜讯信息科技股份有限公司 基于公共文化服务的一站式应用监控预警系统
CN110958321A (zh) * 2019-12-09 2020-04-03 杭州安恒信息技术股份有限公司 一种安全产品监控方法、装置、设备及介质
CN112363442A (zh) * 2020-10-19 2021-02-12 云南电网有限责任公司 一种机房设备故障告警预测侦测与处置的方法
CN113553242A (zh) * 2021-08-16 2021-10-26 中煤科工集团重庆研究院有限公司 基于Zabbix的煤矿联网系统故障处置方法及系统
CN115437889A (zh) * 2022-11-08 2022-12-06 统信软件技术有限公司 一种应急处理方法、系统及计算设备
CN115858288A (zh) * 2022-12-05 2023-03-28 国网江苏省电力有限公司超高压分公司 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL121898A0 (en) * 1997-10-07 1998-03-10 Cidon Israel A method and apparatus for active testing and fault allocation of communication networks
CN101478441A (zh) * 2009-02-03 2009-07-08 江西省电力信息通讯有限公司 电力通信运维支撑应急指挥系统
CN103023695B (zh) * 2012-11-28 2015-04-15 绍兴电力局 基于电力调度自动化的主站系统监测模型
CN103200027A (zh) * 2013-03-01 2013-07-10 中国工商银行股份有限公司 一种定位网络故障的方法、装置及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407081B (zh) * 2016-09-30 2020-05-26 苏州浪潮智能科技有限公司 一种机箱管理系统及服务器
CN106407081A (zh) * 2016-09-30 2017-02-15 郑州云海信息技术有限公司 一种机箱管理系统及服务器
CN106650417A (zh) * 2016-12-13 2017-05-10 广东电网有限责任公司电力科学研究院 一种基于系统告警机制的应用自保护工作模型
CN106789239A (zh) * 2016-12-21 2017-05-31 国网江西省电力公司信息通信分公司 面向电力业务的信息应用系统故障趋势预测方法及装置
CN106779221A (zh) * 2016-12-21 2017-05-31 国网江西省电力公司信息通信分公司 面向电力业务的信息应用系统故障趋势信息获取方法
CN107273272A (zh) * 2017-06-22 2017-10-20 郑州云海信息技术有限公司 一种热插拔设备的监控方法及装置
CN107395651A (zh) * 2017-09-07 2017-11-24 赛尔网络有限公司 服务系统及信息处理方法
CN109271294A (zh) * 2018-09-18 2019-01-25 安徽华博胜讯信息科技股份有限公司 基于公共文化服务的一站式应用监控预警系统
CN110958321A (zh) * 2019-12-09 2020-04-03 杭州安恒信息技术股份有限公司 一种安全产品监控方法、装置、设备及介质
CN112363442A (zh) * 2020-10-19 2021-02-12 云南电网有限责任公司 一种机房设备故障告警预测侦测与处置的方法
CN113553242A (zh) * 2021-08-16 2021-10-26 中煤科工集团重庆研究院有限公司 基于Zabbix的煤矿联网系统故障处置方法及系统
CN115437889A (zh) * 2022-11-08 2022-12-06 统信软件技术有限公司 一种应急处理方法、系统及计算设备
CN115437889B (zh) * 2022-11-08 2023-03-10 统信软件技术有限公司 一种应急处理方法、系统及计算设备
CN115858288A (zh) * 2022-12-05 2023-03-28 国网江苏省电力有限公司超高压分公司 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统

Also Published As

Publication number Publication date
CN105323113B (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN105323113A (zh) 一种基于可视化技术的系统故障应急处置系统及方法
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
CN107995049B (zh) 电力安全区跨区同步故障监测方法、装置和系统
CN103607297A (zh) 一种计算机集群系统的故障处理方法
CN109104349B (zh) 基于CANopen协议的列车网络数据传输方法、系统及其装置
CN107147540A (zh) 高可用性系统中的故障处理方法和故障处理集群
CN101800675B (zh) 故障监控方法、监控设备及通信系统
CN104022904B (zh) 分布式机房it设备统一管理平台
CN112035319B (zh) 一种针对多路径状态的监控告警系统
US20200235986A1 (en) Self-healing telco network function virtualization cloud
CN112073262B (zh) 一种云平台监控方法、装置、设备及系统
CN110740072A (zh) 一种故障检测方法、装置和相关设备
CN109245966A (zh) 云平台的服务状态的监控方法和装置
CN102263651A (zh) Snmp网络管理系统中局端设备连接状态的检测方法
CN110138611A (zh) 自动化运维方法及系统
US20160191359A1 (en) Reactive diagnostics in storage area networks
CN103595572A (zh) 一种云计算集群中节点自修复的方法
CN109104325B (zh) 基于CANopen协议的列车网络数据传输方法、系统及其装置
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
CN103605592A (zh) 一种分布式计算机系统故障检测机制
CN107528705B (zh) 故障处理方法及装置
US10584681B2 (en) Automative system management
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN106407081B (zh) 一种机箱管理系统及服务器
CN102646065A (zh) 具有保护功能的设备上电检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant