CN103490919A - 故障管理系统和故障管理方法 - Google Patents

故障管理系统和故障管理方法 Download PDF

Info

Publication number
CN103490919A
CN103490919A CN201310392087.7A CN201310392087A CN103490919A CN 103490919 A CN103490919 A CN 103490919A CN 201310392087 A CN201310392087 A CN 201310392087A CN 103490919 A CN103490919 A CN 103490919A
Authority
CN
China
Prior art keywords
fault
distributed
handset
monitoring module
handsets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310392087.7A
Other languages
English (en)
Inventor
王洪吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonyou Software Co Ltd
Original Assignee
Yonyou Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonyou Software Co Ltd filed Critical Yonyou Software Co Ltd
Priority to CN201310392087.7A priority Critical patent/CN103490919A/zh
Publication of CN103490919A publication Critical patent/CN103490919A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种故障管理系统,包括:故障监测模块,用于在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;故障处理模块,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。相应地,本发明还提供了一种故障管理方法。通过本发明的技术方案,能够有效管理在分布式计算过程中发生的故障,提供维护人员的工作效率。

Description

故障管理系统和故障管理方法
技术领域
本发明涉及分布式系统管理领域,具体而言,涉及一种故障管理系统和故障管理方法。
背景技术
随着科技的进步,大规模分布式计算成为了现实,动辄使用上百甚至上千台服务器搭建集群。单台服务器的硬盘故障率是4%,但是当一个集群有5000台服务器的时候,硬盘故障率就是99.6%了。而且在这种集群环境下,服务器之间网络通信,任务调度也会产生更多问题,这些问题和故障的处理大多都要求快速和准确,但是维护人员手工定位、排查和解决故障一般都需要很长时间,这带给了维护人员前所未有的巨大压力。
因此,需要一种新的故障管理技术,能够有效管理在分布式计算过程中发生的大多数故障,从而达到快速反应并处理故障,提高维护人员的工作效率,节约时间和成本,同时使分布式计算过程更加稳定的目的。
发明内容
本发明正是基于上述问题,提出了一种新的故障管理技术,能够有效管理在分布式计算过程中发生的大多数故障,从而达到快速反应并处理故障,提高维护人员的工作效率,节约时间和成本,同时使分布式计算过程更加稳定的目的。
有鉴于此,本发明提出了一种故障管理系统,用于管理分布式系统,包括:故障监测模块,用于在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;故障处理模块,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
在该技术方案中,通过故障检测模块实时检测出影响分布式系统运行的故障的详细信息,并马上执行应对故障的措施,达到了前所未有的反应速度,大大的提高了分布式系统维护的工作效率。
其中,该故障管理系统可以设置在独立的服务器上运行,这样保证可以不受到分布式系统故障的影响,从而保证故障管理系统的可靠性。
在上述技术方案中,优选地,所述故障处理模块还用于,检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
在该技术方案中,一旦故障监测模块和分布式系统的连接断开,即不能通过故障监测模块监测分布式系统,此时,系统可以发出连接故障通知或者是采取其他的监控方式继续监控分布式系统,从而保证能够实时的监控到分布式系统的状态。
在上述技术方案中,优选地,所述故障监测模块还包括:设置子模块,用于根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
在该技术方案中,用户或厂商可以根据个人的需要设置监控模块对分布式系统的哪些故障进行检测,比如设置故障类型包括:硬件顺势故障、硬件间歇故障、硬件永久故障、数值错误、非法请求、栈溢出、存储器错误等等,以及设置每种故障类型对应的故障处理操作,这样,保证在检测到分布式系统故障时,能采取对应的故障处理操作自动对故障进行处理。
在上述技术方案中,优选地,所述故障处理模块还包括:报警子模块,在所述故障类型为预设故障类型时,发出报警提示。
在该技术方案中,当分布式系统中的故障类型是无法通过自动采取故障处理操作进行处理的故障时,可以发出报警提示,从而提醒工作人员及时对该故障进行人工处理。当然,提示的方式不仅包括报警提示,也可以是预设的其他的通知方式。
在上述技术方案中,优选地,还包括:故障信息模块,用于对所述故障信息进行显示。
在该技术方案中,用户可以通过故障信息模块查看到故障信息,其中,故障信息可以以故障日志的方式进行显示,优选地,用户还可以根据自定义的条件查询故障信息(即故障日志)。
根据本发明的另一方面,还提供了一种故障管理方法,用于管理分布式系统,包括:步骤202,在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;步骤204,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
在该技术方案中,通过故障检测模块实时检测出影响分布式系统运行的故障的详细信息,并马上执行应对故障的措施,达到了前所未有的反应速度,大大的提高了分布式系统维护的工作效率。
其中,该故障管理系统可以设置在独立的服务器上运行,这样保证可以不受到分布式系统故障的影响,从而保证故障管理系统的可靠性。
在上述技术方案中,优选地,所述步骤204还包括,检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
在该技术方案中,一旦故障监测模块和分布式系统的连接断开,即不能通过故障监测模块监测分布式系统,此时,系统可以发出连接故障通知或者是采取其他的监控方式继续监控分布式系统,从而保证能够实时的监控到分布式系统的状态。
在所述步骤202之前还包括:根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
在该技术方案中,用户或厂商可以根据个人的需要设置监控模块对分布式系统的哪些故障进行检测,比如设置故障类型包括:硬件顺势故障、硬件间歇故障、硬件永久故障、数值错误、非法请求、栈溢出、存储器错误等等,以及设置每种故障类型对应的故障处理操作,这样,保证在检测到分布式系统故障时,能采取对应的故障处理操作自动对故障进行处理。
在上述技术方案中,优选地,所述步骤204还包括:在所述故障类型为预设故障类型时,发出报警提示。
在该技术方案中,当分布式系统中的故障类型是无法通过自动采取故障处理操作进行处理的故障时,可以发出报警提示,从而提醒工作人员及时对该故障进行人工处理。当然,提示的方式不仅包括报警提示,也可以是预设的其他的通知方式。
在上述技术方案中,优选地,还包括:步骤206,对所述故障信息进行显示。
在该技术方案中,用户可以通过故障信息模块查看到故障信息,其中,故障信息可以以故障日志的方式进行显示,优选地,用户还可以根据自定义的条件查询故障信息(即故障日志)。
通过以上技术方案,能够有效管理在分布式计算过程中发生的大多数故障,从而达到快速反应并处理故障,提高维护人员的工作效率,节约时间和成本,同时使分布式计算过程更加稳定的目的。
附图说明
图1示出了根据本发明的实施例的故障管理系统的框图;
图2示出了根据本发明的实施例的故障管理方法的流程图;
图3示出了根据本发明的实施例的故障管理系统的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的故障管理系统的框图。
如图1所示,根据本发明的实施例的故障管理系统100,包括:故障监测模块102,用于在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;故障处理模块104,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
在该技术方案中,通过故障检测模块实时检测出影响分布式系统运行的故障的详细信息,并马上执行应对故障的措施,达到了前所未有的反应速度,大大的提高了分布式系统维护的工作效率。
其中,该故障管理系统可以设置在独立的服务器上运行,这样保证可以不受到分布式系统故障的影响,从而保证故障管理系统的可靠性。
在上述技术方案中,优选地,所述故障处理模块104还用于,检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
在该技术方案中,一旦故障监测模块和分布式系统的连接断开,即不能通过故障监测模块监测分布式系统,此时,系统可以发出连接故障通知或者是采取其他的监控方式继续监控分布式系统,从而保证能够实时的监控到分布式系统的状态。
在上述技术方案中,优选地,所述故障监测模块102还包括:设置子模块1022,用于根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
在该技术方案中,用户或厂商可以根据个人的需要设置监控模块对分布式系统的哪些故障进行检测,比如设置故障类型包括:硬件顺势故障、硬件间歇故障、硬件永久故障、数值错误、非法请求、栈溢出、存储器错误等等,以及设置每种故障类型对应的故障处理操作,这样,保证在检测到分布式系统故障时,能采取对应的故障处理操作自动对故障进行处理。
在上述技术方案中,优选地,所述故障处理模块104还包括:报警子模块1042,在所述故障类型为预设故障类型时,发出报警提示。
在该技术方案中,当分布式系统中的故障类型是无法通过自动采取故障处理操作进行处理的故障时,可以发出报警提示,从而提醒工作人员及时对该故障进行人工处理。当然,提示的方式不仅包括报警提示,也可以是预设的其他的通知方式。
在上述技术方案中,优选地,还包括:故障信息模块106,用于对所述故障信息进行显示。
在该技术方案中,用户可以通过故障信息模块查看到故障信息,其中,故障信息可以以故障日志的方式进行显示,优选地,用户还可以根据自定义的条件查询故障信息(即故障日志)。
图2示出了根据本发明的实施例的故障管理方法的流程图。
如图2所示,根据本发明的实施例的故障管理方法,包括:步骤202,在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;步骤204,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
在该技术方案中,通过故障检测模块实时检测出影响分布式系统运行的故障的详细信息,并马上执行应对故障的措施,达到了前所未有的反应速度,大大的提高了分布式系统维护的工作效率。
其中,该故障管理系统可以设置在独立的服务器上运行,这样保证可以不受到分布式系统故障的影响,从而保证故障管理系统的可靠性。
在上述技术方案中,优选地,所述步骤204还包括,检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
在该技术方案中,一旦故障监测模块和分布式系统的连接断开,即不能通过故障监测模块监测分布式系统,此时,系统可以发出连接故障通知或者是采取其他的监控方式继续监控分布式系统,从而保证能够实时的监控到分布式系统的状态。
在所述步骤202之前还包括:根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
在该技术方案中,用户或厂商可以根据个人的需要设置监控模块对分布式系统的哪些故障进行检测,比如设置故障类型包括:硬件顺势故障、硬件间歇故障、硬件永久故障、数值错误、非法请求、栈溢出、存储器错误等等,以及设置每种故障类型对应的故障处理操作,这样,保证在检测到分布式系统故障时,能采取对应的故障处理操作自动对故障进行处理。
在上述技术方案中,优选地,所述步骤204还包括:在所述故障类型为预设故障类型时,发出报警提示。
在该技术方案中,当分布式系统中的故障类型是无法通过自动采取故障处理操作进行处理的故障时,可以发出报警提示,从而提醒工作人员及时对该故障进行人工处理。当然,提示的方式不仅包括报警提示,也可以是预设的其他的通知方式。
在上述技术方案中,优选地,还包括:步骤206,对所述故障信息进行显示。
在该技术方案中,用户可以通过故障信息模块查看到故障信息,其中,故障信息可以以故障日志的方式进行显示,优选地,用户还可以根据自定义的条件查询故障信息(即故障日志)。
图3示出了根据本发明的实施例的故障管理系统的结构示意图。
如图3所示,根据本发明的实施例的故障管理系统300包括:故障监测模块302,其与分布式系统的子机连接,并在每个子机安装寄宿程序,用来监测故障和传送故障信息。故障监测模块302的工作流程如下:首先,预先定义一些故障类型,如:硬件瞬时故障、硬件间歇故障,硬件永久故障,数值错误,非法请求,栈溢出,存储器错误等等。同时,故障监测模块302中还预先定义一些监测程序,这些监测程序分为两种,一种是在寄宿程序中执行的,一种是在故障管理服务器执行的。然后,设定监测到的故障日志的格式,以及通知方式等信息。一旦发生故障,立即可以通过预先安装在被监测机器中的寄宿程序监测并把监测结果发送到故障管理服务器保存为故障日志;如果寄宿程序出现异常,这也是一种故障,故障管理系统会把该异常记入故障日志并交给故障处理模块,同时由故障管理系统发起监测程序,从外部监测机器故障。当某些故障需要工作人员处理时,则按预设的通知方式发出通知。
故障信息模块306,其与所述的故障监测模块302连接,为故障监测模块302提供故障日志写入的接口。同时,提供对故障日志查询的视图,用户可以根据自定义的条件查询故障日志。
故障处理模块304,其与所述的故障信息模块306连接,获取故障日志。当故障发生时,接收故障日志,并根据故障日志中记录的故障详细信息,执行相应的故障处理程序。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,能够有效管理在分布式计算过程中发生的大多数故障,从而达到快速反应并处理故障,提高维护人员的工作效率,节约时间和成本,同时使分布式计算过程更加稳定的目的。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种故障管理系统,其特征在于,包括:
故障监测模块,用于在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;
故障处理模块,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
2.根据权利要求1所述的故障管理系统,其特征在于,所述故障处理模块还用于,
检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
3.根据权利要求1所述的故障管理系统,其特征在于,所述故障监测模块还包括:
设置子模块,用于根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
4.根据权利要求1所述的故障管理系统,其特征在于,所述故障处理模块还包括:
报警子模块,在所述故障类型为预设故障类型时,发出报警提示。
5.根据权利要求1至4中任一项所述的故障管理系统,其特征在于,还包括:
故障信息模块,用于对所述故障信息进行显示。
6.一种故障管理方法,其特征在于,包括:
步骤202,在与分布式系统中的多个分布式子机建立连接后,对所述多个分布式子机进行监测,并在监测到所述多个分布式子机中的任一分布式子机出现故障时,记录所述任一分布式子机的故障信息;
步骤204,获取所述故障信息,并根据所述故障信息的故障类型对所述任一分布式子机执行对应的预设故障处理操作。
7.根据权利要求6所述的故障管理方法,其特征在于,所述步骤204还包括,
检测所述故障监测模块和所述多个分布式子机的连接状态,并在所述故障监测模块和所述多个分布式子机的连接状态为断开时,发出连接故障通知。
8.根据权利要求6所述的故障管理方法,其特征在于,在所述步骤202之前还包括:
根据接收到的设置指令,对所述故障类型和所述预设故障处理操作之间的关联关系进行设置。
9.根据权利要求6所述的故障管理方法,其特征在于,所述步骤204还包括:
在所述故障类型为预设故障类型时,发出报警提示。
10.根据权利要求6至9中任一项所述的故障管理方法,其特征在于,还包括:
步骤206,对所述故障信息进行显示。
CN201310392087.7A 2013-09-02 2013-09-02 故障管理系统和故障管理方法 Pending CN103490919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310392087.7A CN103490919A (zh) 2013-09-02 2013-09-02 故障管理系统和故障管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310392087.7A CN103490919A (zh) 2013-09-02 2013-09-02 故障管理系统和故障管理方法

Publications (1)

Publication Number Publication Date
CN103490919A true CN103490919A (zh) 2014-01-01

Family

ID=49830891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310392087.7A Pending CN103490919A (zh) 2013-09-02 2013-09-02 故障管理系统和故障管理方法

Country Status (1)

Country Link
CN (1) CN103490919A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158843A (zh) * 2014-07-14 2014-11-19 深圳市中博科创信息技术有限公司 分布式文件存储系统的存储单元失效检测方法及装置
CN104408059A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 一种故障处理的方法及装置
CN105069509A (zh) * 2015-08-05 2015-11-18 上海古鳌电子科技股份有限公司 一种交易处理系统及处理方法
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
CN106066824A (zh) * 2016-05-26 2016-11-02 湖南洋达信息科技有限公司 故障维护管理系统及方法
CN106341281A (zh) * 2016-11-10 2017-01-18 福州智永信息科技有限公司 linux服务器分布式故障检测和恢复方法
CN106384950A (zh) * 2016-11-25 2017-02-08 国网江西省电力公司赣西供电分公司 一种故障自动告警的电力配电柜、及其告警方法
CN106844132A (zh) * 2015-12-03 2017-06-13 北京国双科技有限公司 集群服务器的故障修复方法和装置
CN107272669A (zh) * 2017-08-14 2017-10-20 中国航空无线电电子研究所 一种机载故障管理系统
CN108809729A (zh) * 2018-06-25 2018-11-13 郑州云海信息技术有限公司 一种分布式系统中ctdb服务的故障处理方法及装置
CN111026572A (zh) * 2019-11-15 2020-04-17 北京金山云网络技术有限公司 分布式系统的故障处理方法、装置及电子设备
CN114915541A (zh) * 2022-04-08 2022-08-16 北京快乐茄信息技术有限公司 系统故障排除方法及装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697970B1 (en) * 2000-07-14 2004-02-24 Nortel Networks Limited Generic fault management method and system
CN101520662A (zh) * 2009-02-18 2009-09-02 嘉兴学院 流程工业分布式设备故障诊断系统
CN101719667A (zh) * 2009-12-01 2010-06-02 深圳市科陆电子科技股份有限公司 分布式管理与转移负荷的方法
CN101848478A (zh) * 2010-04-29 2010-09-29 北京交通大学 一种无线传感器网络故障的处理方法
CN102238602A (zh) * 2011-07-04 2011-11-09 南京邮电大学 一种无线传感器网络故障节点检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697970B1 (en) * 2000-07-14 2004-02-24 Nortel Networks Limited Generic fault management method and system
CN101520662A (zh) * 2009-02-18 2009-09-02 嘉兴学院 流程工业分布式设备故障诊断系统
CN101719667A (zh) * 2009-12-01 2010-06-02 深圳市科陆电子科技股份有限公司 分布式管理与转移负荷的方法
CN101848478A (zh) * 2010-04-29 2010-09-29 北京交通大学 一种无线传感器网络故障的处理方法
CN102238602A (zh) * 2011-07-04 2011-11-09 南京邮电大学 一种无线传感器网络故障节点检测方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158843B (zh) * 2014-07-14 2018-01-12 深圳市中博科创信息技术有限公司 分布式文件存储系统的存储单元失效检测方法及装置
CN104158843A (zh) * 2014-07-14 2014-11-19 深圳市中博科创信息技术有限公司 分布式文件存储系统的存储单元失效检测方法及装置
CN104408059A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 一种故障处理的方法及装置
CN105069509A (zh) * 2015-08-05 2015-11-18 上海古鳌电子科技股份有限公司 一种交易处理系统及处理方法
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法
CN106844132A (zh) * 2015-12-03 2017-06-13 北京国双科技有限公司 集群服务器的故障修复方法和装置
CN106066824A (zh) * 2016-05-26 2016-11-02 湖南洋达信息科技有限公司 故障维护管理系统及方法
CN106341281A (zh) * 2016-11-10 2017-01-18 福州智永信息科技有限公司 linux服务器分布式故障检测和恢复方法
CN106384950A (zh) * 2016-11-25 2017-02-08 国网江西省电力公司赣西供电分公司 一种故障自动告警的电力配电柜、及其告警方法
CN107272669A (zh) * 2017-08-14 2017-10-20 中国航空无线电电子研究所 一种机载故障管理系统
CN108809729A (zh) * 2018-06-25 2018-11-13 郑州云海信息技术有限公司 一种分布式系统中ctdb服务的故障处理方法及装置
CN111026572A (zh) * 2019-11-15 2020-04-17 北京金山云网络技术有限公司 分布式系统的故障处理方法、装置及电子设备
CN114915541A (zh) * 2022-04-08 2022-08-16 北京快乐茄信息技术有限公司 系统故障排除方法及装置、电子设备及存储介质
CN114915541B (zh) * 2022-04-08 2023-03-10 北京快乐茄信息技术有限公司 系统故障排除方法及装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN103490919A (zh) 故障管理系统和故障管理方法
CN102111310B (zh) Cdn设备状态监控方法
CN202854567U (zh) 一种监控系统
CN103607297A (zh) 一种计算机集群系统的故障处理方法
CN111884878A (zh) 基于区块链的数据监控方法
CN104022904A (zh) 分布式机房it设备统一管理平台
CN103763127A (zh) 一种设备状态告警监控方法及系统
CN104821900B (zh) 基于移动平台应用的电力通信网应急抢修全程管控系统
CN103067209B (zh) 一种心跳模块自检测方法
CN105712143B (zh) 一种电梯远程监控点检及保养方法
CN104065526A (zh) 一种服务器故障报警的方法和装置
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
CN105007041B (zh) 一种基于八个状态的光伏发电机组性能监测方法
CN101777951A (zh) 一种数据监测的方法和系统
CN103605592A (zh) 一种分布式计算机系统故障检测机制
CN101777248B (zh) 一种在安防联网中系统维护的实现方法
CN103701657A (zh) 用于不间断运行的数据处理系统的异常监控及处理装置和方法
CN205983124U (zh) 一种综合监控系统
CN103995759A (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN110008093A (zh) 计算机远程监控系统
CN108551400A (zh) 一种便携式运维堡垒机系统
CN104394003B (zh) 供电故障处理方法、装置以及供电设备
CN103543730A (zh) 一种贴片机故障诊断系统
CN103560903A (zh) 服务器远程监控及应急处置系统及方法
CN112350889A (zh) 一种监控区块链节点运行状态的系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 Haidian District North Road, Beijing, No. 68

Applicant after: Yonyou Network Technology Co., Ltd.

Address before: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park

Applicant before: UFIDA Software Co., Ltd.

COR Change of bibliographic data
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140101