CN108255646B - 一种基于心跳检测的工控应用程序故障自恢复的方法 - Google Patents

一种基于心跳检测的工控应用程序故障自恢复的方法 Download PDF

Info

Publication number
CN108255646B
CN108255646B CN201810044873.0A CN201810044873A CN108255646B CN 108255646 B CN108255646 B CN 108255646B CN 201810044873 A CN201810044873 A CN 201810044873A CN 108255646 B CN108255646 B CN 108255646B
Authority
CN
China
Prior art keywords
industrial control
application program
personal computer
monitoring system
control application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810044873.0A
Other languages
English (en)
Other versions
CN108255646A (zh
Inventor
屈剑锋
柴毅
李春燕
任浩
王凡
房晓宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Endurance Shanhua Special Vehicle Co ltd
Shenzhen Shenshui Ecological & Environmental Technology Co ltd
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201810044873.0A priority Critical patent/CN108255646B/zh
Publication of CN108255646A publication Critical patent/CN108255646A/zh
Application granted granted Critical
Publication of CN108255646B publication Critical patent/CN108255646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

一种基于心跳检测的工控应用程序故障自恢复的方法本发明公开了一种基于心跳检测的工控应用程序故障自恢复的方法,应用在工业控制及物联网远程监控系统中,其特征在通过监测现场计算机(工控机)运行状况,实时监测工控机中应用程序的运行状态,一旦工控机或者工控应用程序发生死机或者异常崩溃情况,通过远程监控软件及嵌入式设备实现工控机的复位或者重启操作,从而实现对工控机的自动监控和自动恢复,减少由于人工监控的人力浪费和懈怠造成的事故,为工控系统正常稳定的工作提供了保障。

Description

一种基于心跳检测的工控应用程序故障自恢复的方法
技术领域
本发明属于工业自动化在线监测领域,尤其涉及一种基于心跳检测的工控应用程序故障自恢复的方法。
背景技术
工控机(Industrial Personal Computer,IPC)即工业控制计算机,是一种采用总线结构,对生产过程及机电设备、工艺装备进行检测与控制的工具总称。工业控制软件系统主要包括系统软件、工控应用软件和应用软件开发环境等三大部分。其中工控应用软件(工控应用程序)主要是根据用户工业控制和管理的需求而生成的,因此具有专用性。
工控机由于应用行业极为广泛,在诸如无人值守、监控安防、工矿厂房、军事等一些特殊应用领域,对其可靠性有着苛刻要求。在长期使用过程中,工控应用程序和操作系统随着运行时间增加,不可避免的会出现各种问题,最严重时甚至会出现系统死机,造成工作停止,重要数据丢失,从而可能导致严重的经济损失。
发明内容
有鉴于此,本发明的目的在于提供一种基于心跳检测的工控应用程序故障自恢复的方法。该方法兼顾了工控应用程序和工控机的共同状态,采用心跳检测的方法监测工控应用程序的运行状态,采用物联网远程监控系统监测工控机的运行状态,当工控应用程序发生异常崩溃状况立即结束该进程并重新启动该程序,当工控机发生死机状况时立即接通重置开关进行复位,工控应用程序设置开机自启,从而使系统恢复正常的工作状态。
本发明是通过这样的技术方案实现的:一种基于心跳检测的工控应用程序故障自恢复的方法,其特征在于,该系统包括含有工控应用程序、附加程序(用于启动批处理文件)、批处理文件、网口、重置开关RST的工控机,含有CPU、定时器、继电器、温度传感器、网口的嵌入式工控程序监测系统,以及远程监控系统。嵌入式工控程序监测系统通过网络和继电器电路与工控机相连,远程监控系统通过网络与工控机和嵌入式工控程序监测系统相连。
本发明所述的一种基于心跳检测的工控应用程序故障自恢复的方法,其特征在于,该实现方法有如下步骤:
步骤1,启动所述的嵌入式工控程序监测系统,其作为心跳检测的服务器端和工控机复位执行端,长期保持开机状态。
步骤2,启动所述被监控工控机,将所述工控应用程序和所述附加程序均设置为开机自启,分别作为客户端1和客户端2,分配不同的端口。所述工控应用程序执行自身相应功能,同时,通过网口(基于TCP/IP网络)定时发送心跳包给所述嵌入式工控程序监测系统;其中,所述工控机包括工控机阵列。
步骤3,所述嵌入式工控程序监测系统实时接收所述工控应用程序的心跳包,并根据是否接收到心跳包来判断所述工控应用程序或工控机状态是否正常,达到心跳检测目的。
步骤4,所述物联网远程监控系统实时获取监控数据,远程监控工控机和工控应用程序的运行状态,当监测到工控机死机或工控应用程序异常崩溃,则进行系统自恢复。
本发明的有益技术效果为:本发明基于嵌入式监测和在线监测技术实现,技术成熟可靠,简单合理,可操作性强,监测器采用嵌入式工控程序监测系统和物联网远程监控系统相结合的方式,一套系统可集中监测多个工控机,外围电路简单,硬件成本较低。采用本发明可实时监测工控应用程序和工控机工作状态。工控应用程序异常崩溃后可自动重启程序,工控机死机后可自动复位工控机,恢复工控机应用程序正常工作,提高了工业控制的可靠性,避免由于死机导致工作停止,造成重大经济损失,具有非常重要的使用价值和现实意义。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的场景模拟图。
图2为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的系统结构图。
图3为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的系统流程图,其中,包含主程序流程图和子程序流程图。
具体实施方式
为了更清楚的理解本发明,以下结合附图进行详细描述:
图1为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的场景模拟图,图2为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的系统结构图。包括以下系统:工控机;嵌入式工控程序监测系统;物联网远程监控系统。嵌入式工控程序监测系统通过网络和继电器电路与工控机相连,远程监控系统通过网络与工控机和嵌入式工控程序监测系统相连,其中,工控机为工控机阵列,嵌入式工控程序监测系统中的继电器同为继电器阵列,环境温度传感器置于嵌入式工控程序监测系统内,工控机机内温度传感器置于每台工控机内。整个系统运行的过程为:
1)首先将嵌入式工控程序监测系统启动,长期保持开机状态;
2)然后将工控机开机,工控应用程序和附加程序均开机自启,工控应用程序自启后自动与嵌入式工控程序监测系统建立心跳检测连接,开始检测心跳;
3)物联网远程监控系统启动,远程获取工控机的性能数据和嵌入式工控程序监测系统检测到的温度等数据,决策出工控机的健康状况;
4)当决策出工控机即将处于死机状态,远程监控系统发出指令对工控机实行复位操作;
5)当嵌入式工控程序监测系统检测到工控应用程序心跳异常,首先通过物联网远程监控系统Ping工控机IP检测是否通信故障,通信故障则提醒工作人员维修,反之则判断为工控应用程序故障,重启工控应用程序。
图3为本发明所述基于心跳检测的工控机应用程序故障系统恢复的方法的系统流程图,具体实现步骤如下:
步骤1,嵌入式工控程序监测系统(从机)对工控机(主机)进行心跳检测,方法具体如下:
心跳检测是在服务端保存下来所有客户端的状态信息,然后等待客户端定时来访问服务器端,更新自己的当前状态,如果客户端超过指定的时间没有来更新状态,则认为客户端已经宕机或者其状态异常。心跳检测充分利用TCP(Transmission Control Protocol,传输控制协议)本身的可靠性机制来发送心跳包。
本发明中主机工控应用程序作为客户端1,从机作为服务器端,当客户端1连接上服务器端,首先给服务器端发送一个工控应用程序成功启动指令,在能接收到控制对象的数据的前提下,客户端1每隔一段时间向服务器发送一次心跳包,服务器端维护一个在线用户字典,服务器每接收到一次包,字典数据的值更新一次,表明工控应用程序运行正常,继续检测;一旦服务端超过规定时间没有接收到客户端1发来的包,字典数据将会递增加一,当字典数据的值累计大于等于n(以5为例),则视为客户端1掉线,此时停止发送心跳包,等待整个系统的处理。
步骤2,整个系统对掉线的客户端进行处理的方法具体如下:
首先判断系统通信:当所述嵌入式工控程序监测系统接收不到心跳包超过规定次数n次(以5次为例),便通过网络给物联网远程监控系统发送一个标志信号,远程监控系统接收到标志信号后立即Ping所述工控机通信地址IP,Ping通即为工控应用程序异常崩溃,Ping不通则提示通信问题需要维修。而当所述工控应用程序异常崩溃时,所述嵌入式工控程序监测系统通过TCP协议给工控机附加程序(客户端2)发送重启指令,所述附加程序启动批处理文件终止工控应用程序进程并重新启动。其中Ping(Packet Internet Groper),因特网包探索器,是Windows、Unix和Linux系统下的一个命令,用于测试网络连接量的程序。
步骤3,远程监控的具体过程如下:
远程监控系统通过Windows管理规范(Windows Management Instrumentation,简称WMI)协议远程登录到所述工控机上,在Windows下通过调用系统的应用程序编程接口(Application Programming Interface,简称API)实时获取工控机性能数据;通过网口实时获取嵌入式工控程序监测系统中的传感器采集到的环境参数。其中,所述工控机性能数据包括CPU温度、CPU占用率、内存占用率、网络数据流、硬盘占用率等,所述工控机的环境参数包括工控机环境温度和机内温度等。

Claims (4)

1.一种基于心跳检测的工控应用程序故障自恢复的方法,系统包括被监控工控机系统、嵌入式工控机监测系统和物联网远程监控系统三部分;其中,被监控工控机系统至少包含工控应用程序、附加程序、批处理文件、网口和重置开关RST,附加程序用于启动批处理文件;嵌入式工控程序监测系统包含CPU、定时器、继电器、温度传感器和网口,以及远程监控系统主要包含监控应用程序;
包括如下步骤进行:
步骤1,启动所述的嵌入式工控程序监测系统,其作为心跳检测的服务器端和工控机复位执行端,长期保持开机状态;
步骤2,启动所述被监控工控机,将所述工控应用程序和所述附加程序均设置为开机自启,分别作为客户端1和客户端2,分配不同的端口;所述工控应用程序执行自身相应功能,同时,通过网口定时发送心跳包给所述嵌入式工控程序监测系统,网口基于TCP/IP网络;其中,所述工控机包括工控机阵列;
步骤3,所述嵌入式工控程序监测系统实时接收所述工控应用程序的心跳包,并根据是否接收到心跳包来判断所述工控应用程序或工控机状态是否正常,达到心跳检测目的;
步骤4,所述物联网远程监控系统实时获取监控数据,远程监控工控机和工控应用程序的运行状态,当监测到工控机死机或工控应用程序异常崩溃,则进行系统自恢复;
所述步骤2-3心跳检测的具体方法如下:
所述心跳信号为工控应用程序与嵌入式工控程序监测系统之间的TCP握手协议,工控应用程序为客户端,嵌入式工控程序监测系统为服务器端,具体如下:客户端1连接上服务器端,服务器端维护一个在线用户字典,客户端1每隔一段时间向服务器端发送一次心跳包;服务器端每接收到一次心跳包,字典数据的值更新一次,表明工控应用程序运行正常;服务器端设置超时定时器,一旦服务器端超过规定时间没有接收到客户端发来的心跳包,字典数据将会递增,当字典数据的值累计大于等于n,则视为客户端1掉线,工控应用程序运行异常;其中,所述心跳包就是在客户端和服务器间定时通知对方自己状态的一个自己定义的命令字,按照一定的时间间隔发送,类似于心跳。
2.根据权利要求1所述的一种基于心跳检测的工控应用程序故障自恢复的方法,其特征在于,所述步骤4远程监控的具体方法如下:
远程监控系统通过Windows管理规范WMI协议远程登录到所述工控机上,在Windows下通过调用系统的应用程序编程接口API实时获取工控机性能数据;通过网口实时获取嵌入式工控程序监测系统中的传感器采集到的环境参数;其中,所述工控机性能数据包括CPU温度、CPU占用率、内存占用率、网络数据流和硬盘占用率,所述工控机的环境参数包括工控机环境温度和机内温度。
3.根据权利要求1所述的一种基于心跳检测的工控应用程序故障自恢复的方法,其特征在于,所述步骤4自恢复方法如下:
当检测到工控机死机,则发送复位指令到嵌入式工控程序监测系统,所述嵌入式工控程序监测系统对故障工控机执行复位操作,即自动重置开关RST,重启工控机;当所述嵌入式工控程序监测系统接收不到心跳包超过n次,首先检查整个系统内通信是否中断,如果通信中断,则远程监控系统提示人工维护,否则判断所述工控应用程序意外崩溃所致,重启被监测的工控应用程序。
4.根据权利要求2所述的一种基于心跳检测的工控应用程序故障自恢复的方法,其特征在于,所述工控应用程序重启的具体方法如下:
首先判断系统通信:当所述嵌入式工控程序监测系统接收不到心跳包超过n次,便通过网络给远程监控系统发送一个标志信号,远程监控系统接收到标志信号后立即Ping所述工控机通信地址IP,Ping通即为工控应用程序异常崩溃,Ping不通则提示通信问题需要维修;而当所述工控应用程序异常崩溃时,所述嵌入式工控程序监测系统通过TCP协议给工控机附加程序发送重启指令,工控机附加程序为客户端2,所述附加程序启动批处理文件终止工控应用程序进程并重新启动;其中Ping,因特网包探索器,是Windows、Unix和Linux系统下的一个命令,用于测试网络连接量的程序。
CN201810044873.0A 2018-01-17 2018-01-17 一种基于心跳检测的工控应用程序故障自恢复的方法 Active CN108255646B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810044873.0A CN108255646B (zh) 2018-01-17 2018-01-17 一种基于心跳检测的工控应用程序故障自恢复的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810044873.0A CN108255646B (zh) 2018-01-17 2018-01-17 一种基于心跳检测的工控应用程序故障自恢复的方法

Publications (2)

Publication Number Publication Date
CN108255646A CN108255646A (zh) 2018-07-06
CN108255646B true CN108255646B (zh) 2022-02-01

Family

ID=62741414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810044873.0A Active CN108255646B (zh) 2018-01-17 2018-01-17 一种基于心跳检测的工控应用程序故障自恢复的方法

Country Status (1)

Country Link
CN (1) CN108255646B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109379218A (zh) * 2018-09-27 2019-02-22 珠海格力电器股份有限公司 一种虚拟设备控制系统和数据验证方法
CN109491311A (zh) * 2018-11-13 2019-03-19 江苏常熟发电有限公司 一种cems数据传输故障判断方法
CN113454605A (zh) * 2018-11-27 2021-09-28 区块链联合香港有限公司 运算设备维护方法及装置、存储介质和程序产品
CN111800304A (zh) * 2019-04-09 2020-10-20 安克创新科技股份有限公司 进程运行的监测方法、存储介质和虚拟装置
CN110248181B (zh) * 2019-05-27 2020-12-22 北京旷视科技有限公司 外接设备自复位方法、装置、系统和计算机可读介质
CN110300103A (zh) * 2019-06-20 2019-10-01 厦门市美亚柏科信息股份有限公司 无线数据探测设备、修复方法及备份方法
CN110850852A (zh) * 2019-12-05 2020-02-28 成都天玙兴科技有限公司 一种工控设备故障通知系统和方法
CN112918406A (zh) * 2019-12-06 2021-06-08 中车永济电机有限公司 有轨电车的监控系统及有轨电车系统
CN113767893A (zh) * 2021-09-22 2021-12-10 西安京维智网科技有限公司 一种智能驱鸟器及其远程监控与升级方法
CN114390087A (zh) * 2021-12-16 2022-04-22 航天信息股份有限公司 一种税控加油机数据采集设备的控制方法及系统
CN114750774B (zh) * 2021-12-20 2023-01-13 广州汽车集团股份有限公司 安全监测方法和汽车
CN114697377B (zh) * 2022-04-07 2023-09-05 深信服科技股份有限公司 一种客户端产品的保活方法、系统、装置及可读存储介质
CN114710428B (zh) * 2022-04-26 2024-03-29 广州智光储能科技有限公司 应用于储能系统中的通讯保护方法、装置及系统
CN114629941A (zh) * 2022-05-16 2022-06-14 山东纽克信息技术有限公司 一种基于底层远程控制管理维护的运营系统
CN115237644B (zh) * 2022-06-16 2024-04-23 广州汽车集团股份有限公司 系统故障处理方法、中央运算单元以及车辆
CN114928559B (zh) * 2022-07-20 2022-09-27 合肥工业大学 一种基于心跳检测的工控软件输出有效判定方法
CN115514689B (zh) * 2022-09-22 2024-04-02 成都中航信虹科技股份有限公司 一种应用程序守护方法、装置及存储介质
CN117827522B (zh) * 2024-03-04 2024-05-14 四川零点自动化系统有限公司 一种输出模块的故障保护方法、设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104898509A (zh) * 2015-04-30 2015-09-09 杭州谱谐特科技有限公司 一种基于安全短信的工控机监控方法及系统
CN106656589A (zh) * 2016-12-13 2017-05-10 武汉船舶通信研究所 一种服务器双机热备份系统
CN106774120A (zh) * 2016-12-22 2017-05-31 无锡市工业设备安装有限公司 一种简易的设备运行监控故障报警和传输方法
CN106933726A (zh) * 2017-04-24 2017-07-07 苏州恒地智能科技有限公司 一种数据追溯及实时监控管理系统
CN107145428A (zh) * 2017-05-26 2017-09-08 郑州云海信息技术有限公司 一种服务器及服务器监控方法
CN107588801A (zh) * 2017-09-04 2018-01-16 安徽科盟电子科技有限公司 一种电力设备故障远程自诊断装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040165525A1 (en) * 2003-02-10 2004-08-26 Invensys Systems, Inc. System and method for network redundancy
US20070253329A1 (en) * 2005-10-17 2007-11-01 Mo Rooholamini Fabric manager failure detection
CN202155462U (zh) * 2011-04-26 2012-03-07 重庆大学 大型模锻压机故障诊断系统
CN102916838B (zh) * 2012-10-25 2015-05-20 国电南瑞科技股份有限公司 综合监控系统与ats系统接口的实现方法
CN102984029B (zh) * 2012-11-30 2015-07-22 福建星网锐捷网络有限公司 应用于分布式系统的心跳检测装置和方法、网络设备
US9178772B2 (en) * 2013-06-25 2015-11-03 Cisco Technology, Inc. Cumulative node heartbeat relay agents in constrained computer networks
CN105446852B (zh) * 2014-09-28 2018-04-10 中国航空工业集团公司西安飞机设计研究所 一种级联式心跳设计方法
CN206161062U (zh) * 2016-11-17 2017-05-10 天津市环境监测中心 一种用于扬尘在线监测的数据采集系统
CN109358591B (zh) * 2018-08-30 2020-03-13 百度在线网络技术(北京)有限公司 车辆故障处理方法、装置、设备及存储介质
CN110375598B (zh) * 2019-06-11 2022-06-07 重庆大学 一种针对火工品产品测试系统的可靠性分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104898509A (zh) * 2015-04-30 2015-09-09 杭州谱谐特科技有限公司 一种基于安全短信的工控机监控方法及系统
CN106656589A (zh) * 2016-12-13 2017-05-10 武汉船舶通信研究所 一种服务器双机热备份系统
CN106774120A (zh) * 2016-12-22 2017-05-31 无锡市工业设备安装有限公司 一种简易的设备运行监控故障报警和传输方法
CN106933726A (zh) * 2017-04-24 2017-07-07 苏州恒地智能科技有限公司 一种数据追溯及实时监控管理系统
CN107145428A (zh) * 2017-05-26 2017-09-08 郑州云海信息技术有限公司 一种服务器及服务器监控方法
CN107588801A (zh) * 2017-09-04 2018-01-16 安徽科盟电子科技有限公司 一种电力设备故障远程自诊断装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
嵌入式网络测控系统研究与设计;屈剑锋;《计算机测量与控制》;20071025;第15卷;第1283-1286页 *

Also Published As

Publication number Publication date
CN108255646A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN108255646B (zh) 一种基于心跳检测的工控应用程序故障自恢复的方法
CN107315656B (zh) 多内核的嵌入式plc软件恢复方法和plc
CN109471759B (zh) 一种基于sas双控设备的数据库故障切换方法及设备
US6425093B1 (en) Methods and apparatuses for controlling the execution of software on a digital processing system
CN107147540A (zh) 高可用性系统中的故障处理方法和故障处理集群
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
US8943191B2 (en) Detection of an unresponsive application in a high availability system
US11848889B2 (en) Systems and methods for improved uptime for network devices
CN114090184B (zh) 一种虚拟化集群高可用性的实现方法和设备
US9571333B2 (en) Network device and method for maintaining network connection
CN105425932A (zh) 一种整机柜服务器电源的管理方法及系统
CN107528705B (zh) 故障处理方法及装置
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN110740066B (zh) 一种席位不变的跨机故障迁移方法和系统
CN112822039A (zh) 双机热备系统主备模式切换的方法
CN114296995B (zh) 一种服务器自主修复bmc的方法、系统、设备及存储介质
CN116844087A (zh) 操作系统的监控方法、装置以及bmc
CN107896176B (zh) 一种计算节点的处理方法、智能终端及存储介质
CN115549751A (zh) 遥感卫星地面站监控系统和方法
CN104753993A (zh) 一种监控服务器的方法及监控设备
JP3325785B2 (ja) 計算機の故障検出・回復方式
CN114138567A (zh) 一种基板管理控制模块维护方法、装置、设备及存储介质
CN111819557B (zh) 监控IoT设备的方法及其在IoT设备电池保护看门狗上的用途
CN112596940A (zh) 一种多级容错方法、装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231024

Address after: 401346 No.6, Shifo Road, Jieshi Town, Banan District, Chongqing

Patentee after: CHONGQING ENDURANCE SHANHUA SPECIAL VEHICLE Co.,Ltd.

Patentee after: SHENZHEN SHENSHUI ECOLOGICAL & ENVIRONMENTAL TECHNOLOGY CO.,LTD.

Address before: 400044 No. 174 Sha Jie street, Shapingba District, Chongqing

Patentee before: Chongqing University