CN101996106B - 一种对软件运行状态进行监控的方法 - Google Patents

一种对软件运行状态进行监控的方法 Download PDF

Info

Publication number
CN101996106B
CN101996106B CN 201010594050 CN201010594050A CN101996106B CN 101996106 B CN101996106 B CN 101996106B CN 201010594050 CN201010594050 CN 201010594050 CN 201010594050 A CN201010594050 A CN 201010594050A CN 101996106 B CN101996106 B CN 101996106B
Authority
CN
China
Prior art keywords
thread
monitored
running status
universal dynamic
dynamic storehouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010594050
Other languages
English (en)
Other versions
CN101996106A (zh
Inventor
侯腾蛟
李庆军
蔡洪斌
何恒攀
黄巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing ZNV Software Co Ltd
Original Assignee
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing ZNV Software Co Ltd filed Critical Nanjing ZNV Software Co Ltd
Priority to CN 201010594050 priority Critical patent/CN101996106B/zh
Publication of CN101996106A publication Critical patent/CN101996106A/zh
Application granted granted Critical
Publication of CN101996106B publication Critical patent/CN101996106B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种对软件运行状态进行监控的方法,包括以下步骤:创建看门狗监控程序和线程监控通用动态库;被监控应用程序在启动后加载所述线程监控通用动态库,其各个线程分别向线程监控通用动态库注册,线程监控通用动态库保存注册信息;在被监控应用程序运行过程中,线程监控通用动态库实时监控各个线程当前的运行状态并据此更新对应的运行状态维护信息;所述线程监控通用动态库定时查询各个线程的运行状态维护信息,据此判定其中发生故障的线程,将发生故障的线程所属的进程信息通知看门狗监控程序,由其重新启动该进程。采用本发明,能够准确检测出由内部线程发生故障引起的进程挂起的问题,有效保证了被监控应用程序的工作正常。

Description

一种对软件运行状态进行监控的方法
技术领域
 本发明属于看门狗监控领域,尤其涉及一种对软件的运行状况进行实时监控并自动使其恢复正常运行状态的方法。
背景技术
随着计算机软件技术的发展,一些计算机软件由于其自身功能的特殊性和重要性,必须要求其以长期运行的情况下运行。如果因为软件自身的缺陷或者其他异常原因而退出,则需要在无人工干预的情形下自动重启该软件,以保证其连续运行。目前对指定软件的运行状态进行监控和恢复都还没有有效的方法,通常采用的一种方法是在指定软件自身上增加异常时自动重启功能,即软件自身捕捉运行中产生的异常,然后执行系统API再次启动本程序,但是这种方法并不能完全捕捉程序的异常,因此程序依然可能退出,或者即使捕捉到异常,但是在重新启动新程序时,原有程序的进程尚未退出,从而造成同一程序运行多个进程的问题。另外一种方法是通过第三方软件(俗称看门狗)来监视指定进程的方式实现,但是这种方法监视的对象是在进程级,如果程序某个线程出现死锁而造成进程挂起,该方法无法有效判断。综上两种方法都不能有效和准确的保证指定程序的连续运行。
发明内容
本发明的目的在于针对现有方法存在的不能有效判断出线程出现故障造成其所属进程挂起的缺陷,提供一种对软件运行状态进行监控的方法。
本发明是这样实现的,一种对软件运行状态进行监控的方法,包括以下步骤:
创建看门狗监控程序和线程监控通用动态库;
被监控应用程序在启动后加载所述线程监控通用动态库,其各个线程分别向线程监控通用动态库注册,线程监控通用动态库保存注册信息;
在被监控应用程序运行过程中,线程监控通用动态库实时监控各个线程当前的运行状态并据此更新对应的运行状态维护信息;
所述线程监控通用动态库定时查询各个线程的运行状态维护信息,将其中的运行状态维护信息未更新的线程判定为发生故障,将发生故障的线程所属的进程信息通知看门狗监控程序,由其重新启动该进程。
其中,所述线程监控通用动态库包括:为看门狗监控程序提供调用接口的看门狗调用接口模块,为被监控应用程序提供调用接口的应用程序调用接口模块,以及用以实现注册、运行状态维护信息的更新及维护操作的注册更新维护操作模块。 
其中,所述被监控应用程序的各个线程向线程监控通用动态库注册的信息包括线程的名称、线程的id号、所属进程的id号、所属进程的路径。
其中,所述被监控应用程序的各个线程向线程监控通用动态库注册的信息还包括:线程更新失败次数阈值。
其中,所述被监控应用程序的线程包括UI线程和工作者线程。
对于每个UI线程,其运行状态维护信息的更新过程为。
UI线程定时向所述线程监控通用动态库通知其自身的运行状态。
在定时时间内,线程监控通用动态库若接收到UI线程的通知信息,则认定该UI线程处于活动状态,更新其运行状态维护信息,将其对应的更新失败计数器值置0;若未接收到UI线程的通知信息,则认定该UI线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。
其中,所述被监控应用程序的线程包括UI线程和工作者线程。
对于每个工作者线程,其运行状态维护信息更新方法为:
线程监控通用动态库在该工作者线程注册时创建用以检测其状态的事件,定时置位该事件并将其通知对应的工作者线程。
该工作者线程被事件通知唤醒,将该事件复位。
线程监控通用动态库在定时时间内检查该事件是否被复位,若已被复位,则判定对应的工作者线程处于活动状态,更新其运行状态维护信息,将其对应的更新失败计数器值置0;若未被复位,则判定对应的工作者线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。 
其中,所述线程监控通用动态库定时查询发生故障的线程的过程为:所述线程监控通用动态库定时轮询每个线程的运行状态维护信息,若其对应的更新失败计数器值超过该线程在注册时存储的线程更新失败次数阈值,则判定该线程发生故障。
其中,所述看门狗监控程序采用windows服务的方式进行实现。
其中,所述被监控应用程序的数量为至少一个。
本发明实施例与现有技术相比,有益效果在于:
本发明中看门狗监控程序作为服务端、被监控应用程序作为客户端,两者通过共享线程监控通用动态库的方式进行通信,看门狗监控程序可通过线程监控通用动态库同时监视多个被监控应用程序中的所有线程,在线程出现故障时即重启该线程所属的进程以使其恢复正常的运行状态,由于监视对象是在线程级,因而能够准确检测出由内部线程发生故障引起的进程挂起的问题,有效保证了被监控应用程序的工作正常。
附图说明
图1是本发明的应用方式示意图。
图2是本发明实施例提供的对软件进行监控的方法流程图。
图3是本发明实施例提供的UI线程的信息注册及更新流程图。
图4是本发明实施例提供的工作者线程的信息注册及更新流程图。
图5是本发明实施例提供的线程监控通用动态库定时轮询的工作流程图。
图6是本发明实施例提供的线程监控通用动态库的具体结构图。
图7是本发明实施例提供的线程监控通用动态库接受外部申请时对其维护的进程和线程信息进行更新的序列。
图8是本发明实施例提供的线程监控通用动态库在故障判断过程中进行的自维护序列。
具体实施方式
下面将结合具体实施例和附图对本发明作进一步详细的描述。
请参阅图1,本发明的核心思想为创建看门狗监控程序和线程监控通用动态库;看门狗监控程序与被监控应用程序通过共享线程监控通用动态库的方式实现进程间通信。
其中,被监控应用程序,主要负责在启动时向线程监控通用动态库注册,并定时向其更新自己的运行状态信息,包括自身内部所有线程的运行状态信息。
线程监控通用动态库,为看门狗监控程序和被监控应用程序提供通信接口,用以保存各个线程的注册信息(包括线程名称、线程id号、所属进程id号、所述进程的路径等)、各个线程的运行状态维护信息,实时监控各个被监控应用程序和各个线程的运行状态,根据运行状态维护信息判断出现异常的线程,将出现异常的线程所属的进程信息通知看门狗监控程序。
看门狗监控程序,用于在收到线程监控通用动态库的通知时,重启出现异常的线程所属的进程以恢复其正常运行状态。
请参阅图2,本实施例中对软件运行状态进行监控的方法具体包括以下步骤。
201、创建看门狗监控程序和线程监控通用动态库。
202、各个被监控应用程序在启动后,分别加载线程监控通用动态库。
203、被监控应用程序中的各个线程分别向线程监控通用动态库注册,注册信息包括线程名称、线程id号、所属进程id号、所述进程的路径等,同时线程监控通用动态库对注册信息进行存储。
204、在被监控应用程序运行过程中,线程监控通用动态库实时监控各个线程的运行状态,更新各个线程的运行状态维护信息。
205、线程监控通用动态库定时轮询各线程的运行状态维护信息,判断其中发生故障的线程,并将该发生故障的线程所属的进程信息通知看门狗监控程序。
206、看门狗监控程序重启线程监控通用动态库通知的各进程以使其恢复正常的运行状态。
考虑到目前应用程序中的线程类型主要分为UI线程和工作者线程两种,而UI线程和工作者线程的处理有所区别,本实施例将分开对两种线程的注册及运行状态维护信息的更新方法进行描述。
对于UI线程,如图3所示,其信息注册及更新流程为。
301、在被监控应用程序启动的时候,UI线程向线程监控通用动态库中注册其自身信息,包括线程名称、线程id号、所属进程id号、所述进程的路径、线程更新失败次数阈值等。
通过注册,线程监控通用动态库可获取所有进程和线程的唯一标识,用于后期的运行状态维护信息更新。
302、在被监控应用程序运行过程中,UI线程启动其内部定时器,定时向线程监控通用动态库通知其运行状态信息。
同时,在定时时间内,线程监控通用动态库判断是否收到该UI线程的通知消息,若接收到,则认定该UI线程处于活动状态,更新其运行状态维护信息,将其对应的更新失败计数器值置0;若未接收到,则认定该UI线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。
对于工作者线程,如图4所示,其信息注册及更新流程为。
401、在被监控应用程序启动的时候,工作者线程向线程监控通用动态库中注册其自身信息,包括线程名称、线程id号、所属进程id号、所述进程的路径、线程更新失败次数阈值等;同时,工作者线程获取线程监控通用动态库创建的用于检测该线程状态的事件句柄。
402、工作者线程进入工作过程并等待事件通知。
403、在被监控应用程序运行过程中,线程监控通用动态库定时将事先提供给工作者线程的事件置位并向对应的工作者线程发出事件通知;工作者线程被事件通知唤醒后,将该事件复位;同时,在定时时间内,线程监控通用动态库检查上述事件是否被复位,若被复位,则判定该工作者线程处于活动状态,更新其运行状态信息,将其对应的更新失败计数器值置0;若未被置位,则判定该UI线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。
请参阅图5,本实施例中,线程监控通用动态库定时轮询各线程的运行状态维护信息判断其中发生故障的线程的过程包括以下步骤。
501、初始化I=1。
502、根据所存储的注册信息获取第I个进程的信息,如进程id号。
503、初始化J=1。
504、根据所存储的注册信息获取第I个进程的第J个线程的信息,如线程的i号和运行状态维护信息。
505、判断第I个进程的第J个线程的运行状态维护信息中更新失败计数器值是否超过对应的线程更新失败次数阈值,若超过,则判定该线程发生故障并标记;若未超过,则判定该线程为活动状态。
506、判断是否遍历完第I个进程的所有线程,若是,则执行下一步;否则,J++,并返回步骤504。
507、判断是否遍历完所有进程,若是,则结束该流程,否则,I++,并返回步骤502。
在上述方法中,各线程在注册时设置了各自的线程更新失败次数阈值,线程监控通用动态库对各个线程采用了不同的故障判定标准;在其他实施例中,也可设置统一的线程更新失败次数阈值,线程监控通用动态库对各个线程采用统一的故障判定标准。
下面,将对本实施例中线程监控通用动态库、被监控应用程序、看门狗监控程序的内部实现进行进一步描述。
(1)线程监控通用动态库为本发明中最核心的部分,封装了所有线程的注册信息、运行状态维护信息,主要包括三个部分:看门狗调用接口模块、应用程序调用接口模块、注册更新维护操作模块。其具体结构如图6所示,其中,TheApp为动态库主应用程序对象,负责向外部提供需要调用的接口函数,各接口函数包括线程注册更新函数,进程注册更新函数,事件注册函数等;CThreadPort类和CProcessObjMan类共同完成了线程运行状态维护信息的更新和故障判断,从性能角度考虑对进程线程的维护操作采用线程对象的方式;另外,OnTimerRefresh函数为动态库中信息维护的定时器响应函数,用于进行故障判断,并将发生故障的线程所属的进程信息通知看门狗监控程序。如图7所示,该图为线程监控通用动态库接受外部申请时对其维护的进程和线程信息进行更新的序列,通过TheApp向外部提供的接口函数,最终将线程信息更新到动态库中。如图8所示,该图所示为动态库在故障判断过程中进行的自维护序列,OnTimerRefresh函数由设置的定时器驱动,定时对其维护的进程和线程信息进行更新。
(2)看门狗监控程序,相当于服务端,采用windows服务的方式实现; 服务端在启动之后需要进行初始化工作,同时考虑到线程监控通用动态库尽可能地和具体的业务逻辑分开,因此需要服务端向动态库注册回调函数,该函数用于在线程监控通用动态库检测到需要清理的进程时由服务端调用。服务端在完成启动及初始化之后,只需等待线程监控通用动态库的故障通知,在接收到通知时调用预先注册的回调函数以完成进程重启的任务。
(3)被监控应用程序端,各线程需要向线程监控通用动态库提供运行状态信息。
对于UI线程,由于现有技术中线程对象都是通过CWinThread类派生,为了在实现UI线程定时向线程监控通用动态库更新运行状态信息的功能同时不影响正常业务逻辑、减小工作量,需要从CWinThread类派生出新的类CWDThread(在应用程序代码中,只需要将线程类的基类修改为CWDThread即可),同时将各种操作函数封装在该新类中。
对于工作者线程,无法用上面的方法实现,需要通过事件的方式来实现。由于目前的工作者线程都是通过WaitForMultipleObjects函数来实现,因此需要添加单独创建事件,并将事件设置成WaitForMultipleObjects函数需要等待的事件。根据资源由谁创建就由谁回收的原则,事件由线程监控通用动态库分配提供给被监控应用程序。对于在其他类型的操作系统中,事件等待函数需要根据具体情况进行更换,在此不仅仅局限于WaitForMultipleObjects函数。
综上,本发明中,看门狗监控程序作为服务端、被监控应用程序作为客户端,两者通过共享线程监控通用动态库的方式进行通信,看门狗监控程序可通过线程监控通用动态库同时监视多个被监控应用程序中的所有线程,在线程出现故障时即重启该线程所属的进程以使其恢复正常的运行状态。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种对软件运行状态进行监控的方法,其特征在于,该方法包括以下步骤:
创建看门狗监控程序和线程监控通用动态库;所述看门狗监控程序与被监控应用程序通过共享线程监控通用动态库的方式实现进程间通信;
被监控应用程序在启动后加载所述线程监控通用动态库,其各个线程分别向线程监控通用动态库注册,线程监控通用动态库保存注册信息;
在被监控应用程序运行过程中,线程监控通用动态库实时监控各个线程当前的运行状态并据此更新对应的运行状态维护信息;
所述线程监控通用动态库定时查询各个线程的运行状态维护信息,将其中的运行状态维护信息未更新的线程判定为发生故障,将发生故障的线程所属的进程信息通知看门狗监控程序,由其重新启动该进程;所述线程监控通用动态库包括:为看门狗监控程序提供调用接口的看门狗调用接口模块,为被监控应用程序提供调用接口的应用程序调用接口模块,以及用以实现注册、运行状态维护信息的更新及维护操作的注册更新维护操作模块。
2.如权利要求1所述的对软件运行状态进行监控的方法,其特征在于,所述被监控应用程序的各个线程向线程监控通用动态库注册的信息包括线程的名称、线程的id号、所属进程的id号、所属进程的路径。
3.如权利要求2所述的对软件运行状态进行监控的方法,其特征在于,所述被监控应用程序的各个线程向线程监控通用动态库注册的信息还包括:线程更新失败次数阈值。
4.如权利要求3所述的对软件运行状态进行监控的方法,其特征在于,所述被监控应用程序的线程包括UI线程和工作者线程;
对于每个UI线程,其运行状态维护信息的更新过程为:
UI线程定时向所述线程监控通用动态库通知其自身的运行状态;
在定时时间内,线程监控通用动态库若接收到UI线程的通知信息,则认定该UI线程处于活动状态,更新其运行状态维护信息,将其对应的更新失败计数器值置0;若未接收到UI线程的通知信息,则认定该UI线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。
5.如权利要求3所述的对软件运行状态进行监控的方法,其特征在于,所述被监控应用程序的线程包括UI线程和工作者线程;
对于每个工作者线程,其运行状态维护信息更新方法为:
线程监控通用动态库在该工作者线程注册时创建用以检测其状态的事件,定时置位该事件并将其通知对应的工作者线程;
该工作者线程被事件通知唤醒,将该事件复位;
线程监控通用动态库在定时时间内检查该事件是否被复位,若已被复位,则判定对应的工作者线程处于活动状态,更新其运行状态维护信息,将其对应的更新失败计数器值置0;若未被复位,则判定对应的工作者线程发生异常,不更新其运行状态维护信息,将其对应的更新失败计数器值加1。
6.如权利要求4或5所述的对软件运行状态进行监控的方法,其特征在于,所述线程监控通用动态库定时查询发生故障的线程的过程为:
所述线程监控通用动态库定时轮询每个线程的运行状态维护信息,若其对应的更新失败计数器值超过该线程在注册时存储的线程更新失败次数阈值,则判定该线程发生故障。
7.如权利要求1所述的对软件运行状态进行监控的方法,其特征在于,所述看门狗监控程序采用windows服务的方式进行实现。
8.如权利要求1所述的对软件运行状态进行监控的方法,其特征在于,所述被监控应用程序的数量为至少一个。
CN 201010594050 2010-12-17 2010-12-17 一种对软件运行状态进行监控的方法 Expired - Fee Related CN101996106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010594050 CN101996106B (zh) 2010-12-17 2010-12-17 一种对软件运行状态进行监控的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010594050 CN101996106B (zh) 2010-12-17 2010-12-17 一种对软件运行状态进行监控的方法

Publications (2)

Publication Number Publication Date
CN101996106A CN101996106A (zh) 2011-03-30
CN101996106B true CN101996106B (zh) 2012-12-05

Family

ID=43786289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010594050 Expired - Fee Related CN101996106B (zh) 2010-12-17 2010-12-17 一种对软件运行状态进行监控的方法

Country Status (1)

Country Link
CN (1) CN101996106B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9240937B2 (en) * 2011-03-31 2016-01-19 Microsoft Technology Licensing, Llc Fault detection and recovery as a service
CN103425562B (zh) * 2012-05-18 2016-08-31 北京北方微电子基地设备工艺研究中心有限责任公司 软件断联监控系统及方法
CN103902890A (zh) * 2012-12-24 2014-07-02 珠海市君天电子科技有限公司 一种Android程序行为的监控方法及监控系统
CN103064750B (zh) * 2012-12-25 2016-04-27 北京奇虎科技有限公司 一种浏览器控件的中断恢复方法及系统
RU2017145873A (ru) * 2013-03-15 2019-02-20 Эбботт Дайабитиз Кэр Инк. Способы и системы обработки и передачи данных медицинского устройства
CN103645962A (zh) * 2013-12-18 2014-03-19 北京华环电子股份有限公司 基于NiosII系统的看门狗实现方法及装置
CN105224861B (zh) * 2014-06-13 2018-04-06 Tcl集团股份有限公司 一种智能设备的死机状态处理方法及系统
CN105389223B (zh) * 2014-09-04 2018-09-28 上海福网信息科技有限公司 一种系统自检式看门狗
CN105488386B (zh) * 2014-10-13 2020-05-05 腾讯科技(深圳)有限公司 一种iOS终端的防护方法及终端
CN106528316A (zh) * 2016-11-10 2017-03-22 霍尔果斯霹雳互动网络科技有限公司 一种网络游戏服务器防崩溃方法和系统
CN106598817A (zh) * 2017-01-09 2017-04-26 中交航局安装工程有限公司 一种煤堆三维建模数据采集服务端自修复的方法
CN107301072B (zh) * 2017-06-22 2021-03-23 苏州浪潮智能科技有限公司 一种升级文件的自动加载方法及装置
CN107517308A (zh) * 2017-08-07 2017-12-26 惠州Tcl移动通信有限公司 移动终端应用程序异常的检测方法、储存装置及移动终端
KR102313664B1 (ko) 2017-09-30 2021-10-15 후아웨이 테크놀러지 컴퍼니 리미티드 시스템 서비스의 타임아웃을 처리하는 방법 및 디바이스
CN110308943B (zh) * 2018-03-20 2021-10-19 腾讯科技(深圳)有限公司 程序运行方法、装置、计算设备以及存储介质
CN108549553B (zh) * 2018-03-29 2022-04-05 深圳市彬讯科技有限公司 一种基于三维模型云制作的3ds Max进程守护方法与装置
CN108897248A (zh) * 2018-06-07 2018-11-27 浙江国自机器人技术有限公司 一种多cpu控制器和移动机器人
CN110442470B (zh) * 2019-07-26 2023-08-29 高新兴科技集团股份有限公司 一种通信设备的系统稳定性监测及恢复方法
CN110795264A (zh) * 2019-10-14 2020-02-14 杭州海兴电力科技股份有限公司 监控管理方法及系统、智能管理终端
CN111106955B (zh) * 2019-12-17 2022-10-18 山东鲁软数字科技有限公司智慧能源分公司 一种智能站通信网关机及通信方法
CN111143127B (zh) * 2019-12-23 2023-09-26 杭州迪普科技股份有限公司 监管网络设备的方法、装置、存储介质及设备
CN110912785A (zh) * 2019-12-26 2020-03-24 联陆智能交通科技(上海)有限公司 Rsu健康检测方法及系统
CN111352552B (zh) * 2020-03-30 2021-09-10 北京达佳互联信息技术有限公司 一种应用登录方法、装置、电子设备及存储介质
CN112181702B (zh) * 2020-09-23 2023-06-06 北京紫光展锐通信技术有限公司 一种线程监测方法及装置
CN112346946B (zh) * 2020-11-13 2022-06-21 西安交通大学 一种基于控件定位的用户软件操作行为监控方法与系统
CN113434358B (zh) * 2021-04-27 2023-10-13 中国电子科技集团公司第十四研究所 一种软件化雷达信息处理软件的监测方法
CN114443428B (zh) * 2022-01-19 2024-08-30 山东新一代信息产业技术研究院有限公司 一种基于iros的程序内部运行状态监测方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136044A (zh) * 2006-08-29 2008-03-05 联想(北京)有限公司 一种软件看门狗系统和方法
CN101268447A (zh) * 2005-05-26 2008-09-17 美国联合包裹服务公司 软件进程监控
CN101309148A (zh) * 2008-06-24 2008-11-19 中兴通讯股份有限公司 一种软件看门狗系统
CN101739305A (zh) * 2010-02-09 2010-06-16 太仓市同维电子有限公司 操作系统内核级实时看门狗监控装置及其监控方法
CN101794244A (zh) * 2010-03-18 2010-08-04 上海乐毅信息科技有限公司 多线程看门狗监控方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7043726B2 (en) * 2001-03-20 2006-05-09 Hewlett-Packard Development Company, L.P. Binding of processes in network systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101268447A (zh) * 2005-05-26 2008-09-17 美国联合包裹服务公司 软件进程监控
CN101136044A (zh) * 2006-08-29 2008-03-05 联想(北京)有限公司 一种软件看门狗系统和方法
CN101309148A (zh) * 2008-06-24 2008-11-19 中兴通讯股份有限公司 一种软件看门狗系统
CN101739305A (zh) * 2010-02-09 2010-06-16 太仓市同维电子有限公司 操作系统内核级实时看门狗监控装置及其监控方法
CN101794244A (zh) * 2010-03-18 2010-08-04 上海乐毅信息科技有限公司 多线程看门狗监控方法

Also Published As

Publication number Publication date
CN101996106A (zh) 2011-03-30

Similar Documents

Publication Publication Date Title
CN101996106B (zh) 一种对软件运行状态进行监控的方法
CN101799751B (zh) 一种构建主机监控代理软件的方法
CN103607297A (zh) 一种计算机集群系统的故障处理方法
CN107147540A (zh) 高可用性系统中的故障处理方法和故障处理集群
CN101895540B (zh) 用于应用服务进程守护的系统和方法
CN102761439B (zh) Pon接入系统中基于看门狗的异常检测记录装置及方法
CN104021078B (zh) 软件监控装置及方法
CN105095001A (zh) 分布式环境下虚拟机异常恢复方法
CN104199753B (zh) 一种虚拟机应用服务故障恢复系统及其故障恢复方法
CN104410535A (zh) 一种云资源智能监控告警方法
CN102394791A (zh) 宕机恢复方法和系统
CN111901422A (zh) 一种集群中节点的管理方法、系统及装置
CN110134518A (zh) 一种提高大数据集群多节点应用高可用性的方法及系统
CN110119325B (zh) 服务器故障处理方法、装置、设备及计算机可读存储介质
CN101483540A (zh) 一种高端数据通信设备中的主备倒换方法
CN107741876A (zh) 一种虚拟机进程监控系统及方法
CN104216795A (zh) 一种多进程保护系统及其实现方法
CN100373341C (zh) 一种业务进程的分布式分优先级监控方法
WO2023092772A1 (zh) 一种虚拟化集群高可用性的实现方法和设备
CN105242980A (zh) 互补式看门狗系统及互补式看门狗的监测方法
CN113626280B (zh) 集群状态控制方法、装置、电子设备及可读存储介质
CN102750192A (zh) 一种数据平面异常检测的方法和装置
CN104615472A (zh) 一种防止在线刷新bios+me fw失败的方法
CN101771563A (zh) 网络服务程序的监控方法
CN102957563B (zh) Linux集群故障自动恢复方法和Linux集群故障自动恢复系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121205