CN115514689A - 一种应用程序守护方法、装置及存储介质 - Google Patents

一种应用程序守护方法、装置及存储介质 Download PDF

Info

Publication number
CN115514689A
CN115514689A CN202211159117.5A CN202211159117A CN115514689A CN 115514689 A CN115514689 A CN 115514689A CN 202211159117 A CN202211159117 A CN 202211159117A CN 115514689 A CN115514689 A CN 115514689A
Authority
CN
China
Prior art keywords
electronic equipment
broadcast data
target application
electronic device
application program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211159117.5A
Other languages
English (en)
Other versions
CN115514689B (zh
Inventor
石君明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhonghang Xinhong Technology Co ltd
Original Assignee
Chengdu Zhonghang Xinhong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Zhonghang Xinhong Technology Co ltd filed Critical Chengdu Zhonghang Xinhong Technology Co ltd
Priority to CN202211159117.5A priority Critical patent/CN115514689B/zh
Publication of CN115514689A publication Critical patent/CN115514689A/zh
Application granted granted Critical
Publication of CN115514689B publication Critical patent/CN115514689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/082Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/14Arrangements for monitoring or testing data switching networks using software, i.e. software packages

Abstract

本申请提供了一种应用程序守护方法、装置及存储介质,应用于通信网中的电子设备;该方法包括:从节点电子设备向通信网发送第一广播数据;接收来自通信网的第二广播数据;第二广播数据来自原始主节点电子设备、并包括心跳包数据;判断接收第二广播数据的心跳是否超时;若接收第二广播数据的心跳超时,替换原始主节点电子设备成为更新主节点电子设备;以及对其他电子设备进行监测以实现对其他电子设备的守护。实现了通信网中的电子设备互相对彼此的目标应用程序进行守护。根据异常情况及时更换负责对其他电子设备进行守护的主节点电子设备,实现了通信网中的电子设备互相对彼此的目标应用程序进行守护。

Description

一种应用程序守护方法、装置及存储介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种应用程序守护方法、装置及存储介质。
背景技术
随着物联网技术的高速发展,越来越多的设备被部署到边缘前端,如何提高这些前端设备的可靠性就成为了重要的研究课题,而通过对设备中的应用程序进行守护,是提高可靠性的重要手段之一。
现有技术中,采用传统的看门狗机制解决设备中应用程序“挂死”的问题,以保证前端设备的可靠性与稳定性。然而,通过采用传统的看门狗机制对设备进行守护,其对设备稳定性与可靠性所提供的保障是有限的。具体地,在利用看门狗机制对设备中的应用程序进行守护时,难以不能保证系统中所有设备中的应用程序的可靠性与稳定性。
发明内容
本发明实施例的目的在于一种应用程序守护方法、装置、电子设备及存储介质,通过互相对彼此电子设备中的应用程序进行守护,以进一步提高电子设备运行的稳定性与可靠性。
第一方面,本申请实施例提供了一种应用程序守护方法,通信网中的电子设备;所述方法包括:从节点电子设备向所述通信网发送第一广播数据;接收来自所述通信网的第二广播数据;其中,所述第二广播数据来自原始主节点电子设备、并包括心跳包数据;判断接收所述第二广播数据的心跳是否超时;若接收所述第二广播数据的心跳超时,则替换所述原始主节点电子设备成为更新主节点电子设备;以及对其他电子设备进行监测以实现对所述其他电子设备的守护。
上述应用程序守护方法,当电子设备开机时,先将自身设置为从节点电子设备,以从节点电子设备的身份发送第一广播数据,以通过主节点电子设备利用该第一广播数据对其进行守护。以从节点电子设备的身份接收来自原始主节点电子设备的第二广播数据,并判断其心跳是否超时,以确认该原始主节点电子设备是否正常运行。其中,原始主节点设备负责对所有从节点电子设备进行守护。若该第二广播数据心跳超时,则说明负责对所有从节点电子设备进行守护的原始主节点电子设备出现异常,导致其不能正常对从节点电子设备进行守护。此时则替换原始主节点电子设备作为更新主节点电子设备,并根据来自其他从节点电子设备的第二广播数据,对其中的目标应用程序进行守护。因此,通过根据异常情况及时更换负责对其他电子设备进行守护的主节点电子设备,实现了通信网中的电子设备互相对彼此的目标应用程序进行守护。进而在现有技术的基础上,进一步地提高了通信网中电子设备的可靠性与稳定性。
结合第一方面,可选地,所述方法还包括:若接收所述第二广播数据的心跳未超时,则继续保持当前电子设备为从节点电子设备;以及从所述第二广播数据获取、并存储来自所述电子设备的实时状态信息。
上述应用程序守护方法,若该第二广播数据未心跳超时,则说明该原始主节点设备不存在异常状况,从节点设备也就无需替换原始主节点电子设备成为通信网中的更新主节点电子设备。但此时依然将其他电子设备的实时状态信息存储,以便于当从节点电子设备成为更新主节点电子设备时,处理其他电子设备的异常状况。使得当从节点电子设备成为主节点电子设备时,能够第一时间处理其他电子设备中目标应用程序出现的异常情况。提高了电子设备运行时的可靠性与稳定性。
结合第一方面,可选地,其中,所述替换所述原始主节点电子设备成为主节点电子设备,包括:将当前电子设备设置为更新主节点电子设备,并向所述通信网发送第三广播数据;其中,所述第三广播数据包含:用于声明所述当前电子设备成为更新主节点电子设备的第一声明信息;接收通信网中的第四广播数据。判断所述第四广播数据是否包含用于声明所述其他电子设备成为更新主节点电子设备的第二声明信息。若判定所述第四广播数据不包含所述第二声明信息,则从所述第四广播数据中获取、并存储所述其他电子设备的实时状态信息。若判定所述第四广播数据包含所述第二声明信息,则进一步判断所述第一声明信息是否满足预设条件;其中,所述预设条件包括:所述第三广播数据的数据帧身份标识号大于所述第四广播数据的数据帧标识号。若判定所述第三广播数据的数据帧身份标识号大于所述第四广播数据的数据帧标识号,则将当前电子设备重新设置为从节点电子设备,否则将当前电子设备设置为更新主节点电子设备。若判定所述第三广播数据的数据帧身份标识号不大于所述第四广播数据的数据帧标识号,则将当前电子设备重新设置为从节点电子设备,并从所述第四广播数据中获取、并存储所述其他电子设备的实时状态信息。
上述应用程序守护方法,当作为主节点的原始主节点电子设备出现异常状况需要被替换时,其他所有从节点电子设备均会在获得该异常状况的信息时,发出声明其准备替换原始主节点电子设备作为通信网主节点的第二声明信息。而当前从节点设备首先判断该第四广播数据是否包含该第二声明信息。若不包含,则当前电子设备直接替换原始主节电子设备成为通信网中的更新主节点电子设备,同时存储其中包含的其他标电子设备的实时状态信息,并根据该实时状态信息对其他电子设备进行守护。若包含,则根据预设的规则,从若干其他从节点电子设备中选一个作为更新主节点电子设备。避免了当原始主节电子设备出现异常,所有从节点电子设备争相成为更新主节点电子设备的混乱情况。而通过电子设备发出广播数据中唯一标识——数据帧ID,并以ID号最大的作为主节点电子设备的方式,进一步确保了当若干其他从节点电子设备争相成为更新主节点电子设备时,能从中准确地选择出唯一的一个电子设备作为更新主节点电子设备。
结合第一方面,可选地,所述对其他电子设备进行监测以实现对所述其他电子设备的守护,包括:向所述通信网发送第五广播数据;其中,所述第五广播数据包括心跳包数据。接收来自所述通信网的第一广播数据。其中,所述第一广播数据来自所述其他电子设备;以及根据所述第一广播数据判断所述其他电子设备是否存在异常状况。若判定所述其他电子设备存在异常状况,则根据恢复步骤处理所述异常状况。
上述应用程序守护方法,当从节点电子设备成为更新主节点电子设备,通过发送第五广播数据使所有从节点电子设备获知当前通信网中存在主节点电子设备,并且正在正常的履行作为主节点电子设备对从节点电子设备中目标应用程序进行守护的职责。随后,获取来自从节点电子设备的第一广播数据,从第一广播数据中获取从节点电子设备的运行状况,以便出现异常时对异常进行处理。因而,提高了电子设备运行时的可靠性与稳定性。
结合第一方面,可选地,其中,所述第一广播数据包括心跳包数据;所述恢复步骤包括如下第一恢复步骤:判断接收所述第一广播数据的心跳是否超时;若判定接收的所述第一广播数据的心跳超时,则确认所述其他电子设备中的目标应用程序挂死;利用远程复位程序对所述目标应用程序进行重启,并进一步判断所述对所述目标应用程序进行重启的次数是否超过预设的次数阈值;若判定所述对所述目标应用程序进行重启的次数超过预设的次数阈值,则利用所述远程复位程序启动所述其他电子设备中的目标应用程序相应的备用程序。
上述应用程序守护方法,通过判断包括有心跳数据的第一广播数据是否心跳超时,得出从节点电子设备中的目标应用程序是否挂死的判定结果。具体地,若心跳超时,则说明该目标应用程序已经掉线,掉线的原因包括该目标应用程序挂死。此时,由主节点电子设备利用远程复位程序对该目标应用程序进行重启,使之恢复正常运行。此外,还存在某些目标应用程序挂死之后,远程复位程序对其进行重启却并不能成功的情况。因而,通过预先设置重启的次数阈值。在利用远程复位重启的过程中,重启的次数超过预设的次数阈值时,则说明通过远程复位程序并不能使该目标应用程序成功恢复正常运行。因而,则可利用远程复位程序启动该从节点电子设备中的目标应用程序相应的备用程序。以确保该从节点电子设备依然正常运行。进而,进一步地提高了电子设备运行的稳定性与可靠性。
结合第一方面,可选地,其中,所述第一广播数据包括所述目标应用程序的路径信息;所述利用所述远程复位程序启动所述其他电子设备中的目标应用程序相应的备用程序,包括:利用所述远程复位程序根据所述路径信息启动所述其他电子设备中的目标应用程序相应的备份程序。
上述应用程序守护方法,通过目标应用程序的路径信息,可获得该目标应用程序相应的备用程序的路径信息。当需要启动备用程序时,通过该路径信息,使得远程复位程序能够快速准确地调取该备用程序。也进一步地提高了电子设备运行的稳定性与可靠性。
结合第一方面,可选地,其中,所述恢复步骤包括如下第二恢复步骤:解析所述第一广播数据,获得所述其他电子设备中的目标应用程序的实时状态信息;判断所述实时状态信息是否超过预设门限值;若判定所述实时状态信息超过预设门限值,则确认所述其他电子设备中的目标应用程序存在异常;处理所述异常以使所述其他电子设备中的目标应用程序恢复正常。
上述应用程序守护方法,当通信网中的电子设备运行时,除了会发生目标应用程序挂死的情况之外,还可能发生目标应用程序还未挂死,但却出现了异常运行的情况。此情况下,目标应用程序虽然未完全挂死,但是运行异常已经导致了其性能的降低,进而降低了该电子设备的可靠性。而通过从第一广播数据中解析出该目标应用程序的工作状态信息,并判断该工作状态信息是否超过门限值,以确定该目标应用程序是否存在异常。若存在异常,则针对具体的异常情况进行处理,使之恢复正常运行,保证目标应用程序以最佳的状态运行。进而提高了电子设备的可靠性。
结合第一方面,可选地,所述处理所述异常以使所述其他电子设备中的目标应用程序恢复正常之后,所述方法还包括:检测所述其他电子设备中的目标应用程序是否成功恢复正常;若判定所述其他电子设备中的目标应用程序未恢复正常,则输出用以提示人工处理的预警信息。
上述应用程序守护方法,当完成对从节点电子设备中目标应用程序的异常处理时,通过检测该目标应用程序是否成功恢复正常,以确定是否需要人工处理该异常。若检测出该目标应用程序并未成功恢复正常,则输出用以提示人工处理的预警信息,以提醒工作人员及时处理该异常情况,使该目标应用程序尽快恢复正常。因此,提高电子设备运行的稳定性与可靠性。
第二方面,本申请实施例提供了一种目标应用程序守护装置,应用于通过通信连接形成通信网的若干电子设备;所述装置包括:发送模块,用于将当前电子设备设置为从节点电子设备,并向所述通信网发送第一广播数据;接收模块,用于接收来自所述通信网的第一广播数据、以及第二广播数据;其中,所述第一广播数据、以及第二广播数据来自所述原始主节点电子设备、并包括心跳包数据;判断模块,用于判断接收所述第二广播数据的心跳是否超时;替换模块,用于若接收所述第二广播数据的心跳超时,则替换所述原始主节点电子设备成为更新主节点电子设备;以及守护模块,用于对其他电子设备进行监测以实现对所述其他电子设备的守护。
上述目标应用程序守护装置具有与上述第一方面,或第一方面的任意一种可选的实施方式所提供的一种目标应用程序守护方法相同的有益效果,此处不作赘述。
第三方面,本申请实施例还提供了一种存储介质该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。
上述计算机可读存储介质具有与上述第一方面,或第一方面的任意一种可选的实施方式所提供的一种目标应用程序守护方法相同的有益效果,此处不作赘述。
综上所述,本发明提供的应用程序守护方法,通过通信网中的电子设备中,选取出一个作为主节点电子设备,针对不同的异常情况,采用不同的方式对其进行处理。具体地,若目标应用程序挂死,则对其远程重启或者启动备用程序;若程序仅出现异常运行,但还未完全挂死,则根据相应的异常状况进行恢复处理。因而,通过增加能够处理异常类型,提高了异常处理的能力。此外,对从节点电子设备进行守护的原始主节点电子设备出现异常时,通过从节点电子设备替换原始主节点电子设备,对通信网中的其他电子设备进行守护,保证了通信网中所有电子设备出现异常均能够通过其他电子设备来处理。进一步提高了电子设备运行的稳定性与可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的应用程序守护方法流程示意图;
图2为本申请实施例提供的应用程序守护方法中步骤S140的详细流程示意图;
图3为本申请实施例提供的应用程序守护方法中步骤S150的详细流程示意图;
图4为本申请实施例提供的应用程序守护方法中第一恢复步骤流程示意图;
图5为本申请实施例提供的应用程序守护方法中第二恢复步骤流程示意图;
图6为本申请实施例提供的应用程序守护装置的功能模块示意图。
具体实施方式
下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
在本申请实施例的描述中,技术术语“第一”、“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
在现有技术中,尤其在嵌入式系统中,采用传统的看门狗机制解决设备中应用程序“挂死”的问题,以保证前端设备的可靠性与稳定性。但是,由于此类方式仅仅只能解决应用程序“挂死”的问题,而不能解决应用程序被挂死之前所出现的异常。并且,由于现有技术中,负责进行守护的设备与被守护的设备是固定的。针对此类方式,要保证负责守护的设备的可靠性与稳定性,就得额外配置其他电子设备,以保证负责守护的设备的可靠性与稳定性,这无疑增加了整个系统的负担与成本。因此,上述现有技术中的方案,对设备稳定性与可靠性所提供的保障是相当有限的。为此,本申请提供一种应用程序守护方法、装置、电子设备及存储介质,以解决上述现有技术中所存在的问题。具体地,请参阅本申请提供的实施例及附图。
请参见图1,图1是本申请实施例提供的应用程序守护方法流程示意图,应用程序守护方法应用于通信网中的电子设备,该方法包括如下步骤。
步骤S110:从节点电子设备向通信网发送第一广播数据。
上述步骤S110中,在通信网中的各个电子设备中,主节点电子设备负责对从节点电子设备进行守护。在当前电子设备开机之后,在不确定当前通信网中是否存在正常运行的诸恶节点电子设备的前提下,先将当前电子设备设置为从节点电子设备。并以从节点电子设备的身份向通信网中发送第一广播数据,以备主节点电子设备利用该第一广播数据对其进行守护。其中,第一广播数据用以表明当前电子设备身份,并包含当前电子设备的实时状态信息。该第一广播数据发送至通信网中,通信网中的所有其他电子设备均能够收到该第一广播数据。因此,称之为广播数据。
在步骤S110之后,执行步骤S120:接收来自通信网的第二广播数据;其中,第二广播数据来自原始主节点电子设备、并包括心跳包数据。
上述步骤S120中,当前电子设备以从节点电子设备的身份接收来自原始主节点电子设备的第二广播数据,第二广播数据包括心跳包数据。因此,第二广播数据是每经过固定间隔时间便发送一次或多次的。第二广播数据用以表明发送该第二广播数据的电子设备为主节点电子设备。
在步骤S120之后,执行步骤S130:判断接收第二广播数据的心跳是否超时;
上述步骤S130中,作为从节点电子设备的当前电子设备判断其接收到第二广播数据是否在上述固定时间间隔以内,以确定原始主节点电子设备的状态是否正常。
若接收第二广播数据的心跳超时,则执行步骤S140与步骤S150。
步骤S140:替换原始主节点电子设备成为更新主节点电子设备。
上述步骤S140的实施方式,若接收到该第二广播数据超时(包括未接收到该第二广播数据的情况),则说明原始主节点电子设备可能掉线或者出现其他异常情况。此时,原始主节点电子设备已不能正常地对当前电子设备以及其他从节点电子设备的应用程序进行守护了。因此,由作为从节点电子设备的当前电子设备替换原始主节点电子设备,成为更新主节点电子设备。以准备以更新主节点电子设备的身份对其他电子设备的应用程序进行守护。
步骤S150:对其他电子设备进行监测以实现对其他电子设备中目标应用程序的守护。
上述步骤S150中,在当前电子设备成为更新电子设备之后,便通过对其他电子设备进行监测,以对其中的应用程序进行守护。
上述实现过程中,当电子设备开机时,先将自身设置为从节点电子设备,以从节点电子设备的身份发送第一广播数据,以备主节点电子设备利用该第一广播数据对其进行守护。以从节点电子设备的身份接收来自原始主节点电子设备的第二广播数据,并判断其心跳是否超时,以确认该原始主节点电子设备是否正常运行。其中,原始主节点设备负责对所有从节点电子设备进行守护。若该第二广播数据心跳超时,则说明负责对所有从节点电子设备进行守护的原始主节点电子设备出现异常,导致其不能正常对从节点电子设备进行守护。此时则替换原始主节点电子设备作为更新主节点电子设备,并根据来自其他从节点电子设备的第二广播数据,对其中的目标应用程序进行守护。因此,通过根据异常情况及时更换负责对其他电子设备进行守护的主节点电子设备,实现了通信网中的电子设备互相对彼此的目标应用程序进行守护。进而在现有技术的基础上,进一步地提高了通信网中电子设备的可靠性与稳定性。
请继续参见图1,一种可能的实施方式,应用程序守护方法还包括:
若接收第二广播数据的心跳未超时,则执行步骤S160与步骤S170。
步骤S160:继续保持当前电子设备为从节点电子设备。
上述步骤S160中,若接收到该第二广播数据的心跳未超时,则说明未发现任何原始主节点电子设备存在异常状况。也即是,原始主节点电子设备正在正常地对包括当前电子设备在内的从节点电子设备中目标应用程序进行守护。此时,从节点设备也就无需替换原始主节点电子设备,以成为通信网中的更新主节点电子设备。因此,当前电子设备继续保持从节点电子设备身份在通信网中运行即可。
步骤S170:从第二广播数据获取、并存储来自电子设备的实时状态信息。
上述步骤S170中,由于原始主节点电子设备随时有可能出现异常,导致其需要被从节点电子设备替换。身为从节点电子设备的当前电子设备也存在成功替换原始主节点电子设备,成为更新主节点电子设备的可能性。因此,依然将其他电子设备的实时状态信息存储。其他电子设备的实时状态信息同样来自于,按照上述方法步骤所发送的广播数据。
上述实现过程中,若该第二广播数据未心跳超时,则说明该原始主节点设备不存在异常状况,从节点设备也就无需替换原始主节点电子设备成为通信网中的更新主节点电子设备。但此时依然将其他电子设备的实时状态信息存储,以便于当从节点电子设备成为更新主节点电子设备时,处理其他电子设备的异常状况。使得当从节点电子设备成为主节点电子设备时,能够第一时间处理其他电子设备中目标应用程序出现的异常情况。提高了电子设备运行时的可靠性与稳定性。
请参见图2,图2是本申请实施例提供的应用程序守护方法中步骤S140的详细流程示意图;一种可能的实施方式中,上述步骤S140包括:
步骤S141:将当前电子设备设置为更新主节点电子设备,并向通信网发送第三广播数据;其中,第三广播数据包含:用于声明当前电子设备成为更新主节点电子设备的第一声明信息。
上述步骤S141中,在接收来自原始主节点电子设备的第二广播数据超时的前提下,将从节点电子设备的当前电子设备设置成更新主节点电子设备。同时,通过向通信网中发送包括第一声明信息的第三广播数据,向其他从节点电子设备声明:当前电子设备已替换原始主节点电子设备,成为更新主节点电子设备。同时,其他从节点电子也按照本步骤S141,成为更新主节点电子设备并向通信网中广播。
在步骤S141之后,执行步骤S142:接收通信网中的第四广播数据。
上述步骤S142中,如同前面对步骤S141的解释中所述,除当前电子设备以外,其他从节点电子设备也会按照上述S141执行相应的操作。因此,作为从节点电子设备的当前电子设备便从通信网中获取来自该其他从节点电子设备的第四广播数据。
在步骤S142之后,执行步骤S143:判断第四广播数据是否包含用于声明其他电子设备成为更新主节点电子设备的第二声明信息。
上述步骤S143中,在获取到来自其他从节点电子设备的第四广播数据之后,判断其中是否包含用于声明该电子设备同样也成为更新主节点电子设备的第二声明信息,以判断除当前电子设备以外,通信网中是否还存在其更新主节点电子设备。
若不包含,则执行步骤S144:从第四广播数据中获取、并存储其他电子设备的实时状态信息。
上述步骤S144中,若第四广播数据中不包含该第二声明信息,则说明当前通信网中,仅只有当前电子设备替换原始主节点设备,成为了更新主节点电子设备。而正式成为更新主节点电子设备以后,则以主节点的身份获取其他电子设备的实时状态信息,以便于对其他电子设备中的目标应用程序进行守护。
若包含,则执行步骤S145:判断第一声明信息是否满足预设条件;其中,预设条件包括:第三广播数据的数据帧身份标识号大于第四广播数据的数据帧标识号。
上述步骤S145中,若第四广播数据中包含该第二声明信息,则说明当前通信网中,存在不止一个更新主节点电子设备。因此,需要从这些设备中,选择出一个作为更新主节点电子设备。选择的方式是:从这些电子设备选择所发送广播数据的数据帧身份标识号(ID,Identity Document)数字最大的一者作为更新主节点电子设备。具体地,关于当前电子设备,则判断由当前电子设备发送的第三广播数据的数据帧身份标识号大于第四广播数据的数据帧标识号。并且,其他从节点电子设备也按照上述步骤,执行相应的操作。
若是,则执行步骤S146:将当前电子设备设置为更新主节点电子设备。
上述步骤S146中,若第三广播数据的数据帧身份标识号大于第四广播数据的数据帧标识号,则说明当前电子设备相较于其中某一个参与比较的其他电子设备,更具有“资格”成为更新电子设备。通过反复执行上述步骤S146,实现在通信网中的电子设备逐个进行两两对比,便可选择出最终能够成为更新主节点电子设备的当前电子设备。因此,基于上述判断结果,当前电子设备便成功成为更新主节点电子设备。
若否,则执行步骤S147:将当前电子设备重新设置为从节点电子设备,并从第四广播数据中获取、并存储其他电子设备的实时状态信息。
上述步骤S147中,基于上述对步骤S146解释中的论述,根据该判断结果,则说明当前电子设备相较于其他从节点电子设备“还不够资格”成为更新主节点电子设备。因此,将当前电子设备重新设置为从节点电子设备。同时,依然从第四广播数据中获取、并存储其他电子设备的实时状态信息,以准备在后续,当前电子设备成为更新主节点电子设备之后,以更新主节点电子设备的身份,根据上述实时状态信息对其他电子设备中目标应用程序进行守护。
上述实现过程中,当作为主节点的原始主节点电子设备出现异常状况需要被替换时,其他所有从节点电子设备均会在获得该异常状况的信息时,发出声明其准备替换原始主节点电子设备作为通信网主节点的第二声明信息。而当前从节点设备首先判断该第四广播数据是否包含该第二声明信息。若不包含,则当前电子设备直接替换原始主节电子设备成为通信网中的更新主节点电子设备,同时存储其中包含的其他标电子设备的实时状态信息,并根据该实时状态信息对其他电子设备进行守护。若包含,则根据预设的规则,从若干其他从节点电子设备中选一个作为更新主节点电子设备。避免了当原始主节电子设备出现异常,所有从节点电子设备争相成为更新主节点电子设备的混乱情况。而通过电子设备发出广播数据中唯一标识——数据帧ID,并以ID号最大的作为主节点电子设备的方式,进一步确保了当若干其他从节点电子设备争相成为更新主节点电子设备时,能从中准确地选择出唯一的一个电子设备作为更新主节点电子设备。
请参见图3,图3是本申请实施例提供的应用程序守护方法中步骤S150的第一种详细流程示意图;一种可能的实施方式中,上述步骤S150包括:
步骤S151:向通信网发送第五广播数据;其中,第五广播数据包括心跳包数据。
上述步骤S151中,在当前电子设备成为更新主节点电子设备之后,向通信网发送第五广播数据,以使其他所有从节点电子设备获知当前通信网中存在主节点电子设备。并且,心跳包的形式,定时地送该第五广播数据,以使其他所有从节点电子设备能够持续获知当前通信网中存在主节点电子设备。
在步骤S151之后,执行步骤S152:接收来自通信网的第一广播数据;其中,第一广播数据来自其他电子设备。
上述步骤S152中,通过接收来自其他电子设备的第一广播数据,从第一广播数据中获取其他电子设备中应用程序的运行状态。
在步骤S152之后,执行步骤S153:根据第一广播数据判断其他电子设备是否存在异常状况。
上述步骤S153中,根据获取到的其他电子设备中应用程序的运行状态,判断其运行过程中是否存在异常。
若存在异常,则执行步骤S154:根据恢复步骤处理异常状况。
上述步骤S154中,若根据其他电子设备中应用程序的运行状态判断出该应用程序存在异常,则根据异常的类型对其进行处理。处理异常的方式可采用本申请后续实施例中所介绍的方式,也可采用其他本领域技术人员所公知的方式。
上述实现过程中,当从节点电子设备成为更新主节点电子设备,通过发送第五广播数据使所有从节点电子设备获知当前通信网中存在主节点电子设备,并且正在正常的履行作为主节点电子设备对从节点电子设备中目标应用程序进行守护的职责。随后,获取来自从节点电子设备的第一广播数据,从第一广播数据中获取从节点电子设备的运行状况,以便出现异常时对异常进行处理。因而,提高了电子设备运行时的可靠性与稳定性。
请参见图4,图4是本申请实施例提供的应用程序守护方法中第一恢复步骤流程示意图;一种可能的实施方式中,第一广播数据包括心跳包数据;上述步骤S154中的恢复步骤包括:
步骤S1541:判断接收第一广播数据的心跳是否超时。
上述步骤S1541中,判断包括有心跳数据的第一广播数据是否心跳超时,以得出从节点电子设备中的目标应用程序是否挂死的判定结果。
若判定接收的第一广播数据的心跳超时,执行步骤S1542:确认其他电子设备中的目标应用程序挂死。
上述步骤S1542中,若心跳超时,则说明该目标应用程序已经掉线,掉线的原因包括该目标应用程序挂死。
在步骤S1542之后,执行步骤S1543:利用远程复位程序对目标应用程序进行重启,并进一步判断对目标应用程序进行重启的次数是否超过预设的次数阈值。
上述步骤S1543中,在确定该目标应用程序挂死之后,由主节点电子设备利用远程复位程序对该目标应用程序进行重启,使之恢复正常运行。具体地,可利用SSH远程访问控制协议对目标应用程序进行重启。然而,还存在某些目标应用程序挂死之后,远程复位程序对其进行重启却并不能成功的情况。因而,通过预先设置重启的次数阈值。并通过判断重启次数是否超过该次数阈值,确定该目标应用程序是否成功重新启动。
若判定对目标应用程序进行重启的次数超过预设的次数阈值,则执行步骤S1544:利用远程复位程序启动其他电子设备中的目标应用程序相应的备用程序。
上述步骤S1544中,若判断出目标应用程序的重启次数超过预设的次数阈值,则可得出该目标应用程序并不能使该目标应用程序成功恢复正常运行。因而,利用远程复位程序启动该从节点电子设备中的目标应用程序相应的备用程序。
上述实现过程中,通过判断包括有心跳数据的第一广播数据是否心跳超时,得出从节点电子设备中的目标应用程序是否挂死的判定结果。具体地,若心跳超时,则说明该目标应用程序已经掉线,掉线的原因包括该目标应用程序挂死。此时,由主节点电子设备利用远程复位程序对该目标应用程序进行重启,使之恢复正常运行。此外,还存在某些目标应用程序挂死之后,远程复位程序对其进行重启却并不能成功的情况。因而,通过预先设置重启的次数阈值。在利用远程复位重启的过程中,重启的次数超过预设的次数阈值时,则说明通过远程复位程序并不能使该目标应用程序成功恢复正常运行。因而,则可利用远程复位程序启动该从节点电子设备中的目标应用程序相应的备用程序,以确保该从节点电子设备依然正常运行。进而,进一步地提高了电子设备运行的稳定性与可靠性。
一种可能的实施方式中,其中,第一广播数据包括目标应用程序的路径信息;上述步骤S1544包括:
步骤S15441:利用远程复位程序根据路径信息启动其他电子设备中的目标应用程序相应的备份程序。
上述步骤S15441中,根据目标应用程序的路径信息,可确定出该目标应用程序相应的备份程序的路径信息。当需要启动备用程序时,通过该路径信息,使得远程复位程序能够快速准确地调取该备用程序。
上述实现过程中,通过目标应用程序的路径信息,可获得该目标应用程序相应的备用程序的路径信息。当需要启动备用程序时,通过该路径信息,使得远程复位程序能够快速准确地调取该备用程序。也进一步地提高了电子设备运行的稳定性与可靠性。
请参见图5,图5是本申请实施例提供的应用程序守护方法中第二恢复步骤流程示意图;一种可能的实施方式中,上述步骤S154中的恢复步骤包括:
步骤S1545:解析第一广播数据,获得其他电子设备中的目标应用程序的实时状态信息。
上述步骤S1545中,由于该第一广播数据是以心跳包的方式发送,因此,在获取到该第一广播数据之后,将其解析以获得对应电子设备中目标应用程序的实时状态信息。
在步骤S1545之后,执行步骤S1546:判断实时状态信息是否超过预设门限值。
上述步骤S1546中,通过解析得到实时状态信息,判断该目标应用程序是否超过门限值,如:目标应用程序的CPU占用率是否超过预设值、耗电量是否超过预设值或网络速度是否低于门限值等。
若判定实时状态信息超过预设门限值,则执行步骤S1547:确认其他电子设备中的目标应用程序存在异常。
上述步骤S1547中,若目标应用程序的各项参数中,有一项或者几项超过预设值,则将该目标应用的运行状态判定为异常。
在步骤S1547之后,执行步骤S1548:处理异常以使其他电子设备中的目标应用程序恢复正常。
上述步骤S1548中,根据该实时状态信息获得的目标程序中,哪几项参数存在异常,则根据相应的异常情况采取相应的处理措施。具体的处理措施,可根据本领域技术人员所公知的方式对上述异常进行处理。
上述实现过程中,当通信网中的电子设备运行时,除了会发生目标应用程序挂死的情况之外,还可能发生目标应用程序还未挂死,但却出现了异常运行的情况。此情况下,目标应用程序虽然未完全挂死,但是运行异常已经导致了其性能的降低,进而降低了该电子设备的可靠性。而通过从第一广播数据中解析出该目标应用程序的工作状态信息,并判断该工作状态信息是否超过门限值,以确定该目标应用程序是否存在异常。若存在异常,则针对具体的异常情况进行处理,使之恢复正常运行,保证目标应用程序以最佳的状态运行。进而提高了电子设备的可靠性。
一种可选的实施方式中,在上述步骤S1548之后,应用程序守护方法还包括:
步骤S1549:检测其他电子设备中的目标应用程序是否成功恢复正常;
上述步骤S1549中,检测该电子设备中目标应用程序是否成功恢复正常运行的方式,可以但不限于是,获取经过异常处理后的该电子设备的广播数据,该电子设备的广播数据中包含其经过异常处理后的运行状态。通过该运行状态获知该其他电子设备是否成功恢复正常。
若判定其他电子设备中的目标应用程序未恢复正常,则执行步骤S1540:输出用以提示人工处理的预警信息。
上述步骤S1540中,输出用于提示工作人员的处理的预警信息可以是:由当前电子设备输出报警提示,也可以由出现异常的电子设备输出报警提示。报警提示可以电子设备输出的弹窗消息,也可以是由音频设备输出的报警提示音,本申请对预警信息的类型不做具体限制。
上述实现过程中,当完成对从节点电子设备中目标应用程序的异常处理时,通过检测该目标应用程序是否成功恢复正常,以确定是否需要人工处理该异常。若检测出该目标应用程序并未成功恢复正常,则输出泳衣提示人工处理的预警信息,以提醒工作人员及时处理该异常情况,使该目标应用程序尽快恢复正常。因此,提高电子设备运行的稳定性与可靠性。
请参见图6,图6是本申请实施例提供的应用程序守护装置600的功能模块示意图;基于同样的构思,本申请实施例提供了一种应用程序守护装置600,包括如下模块:
发送模块610,用于利用从节点电子设备向通信网发送第一广播数据。
接收模块620,用于接收来自通信网的第二广播数据;其中,第二广播数据来自原始主节点电子设备、并包括心跳包数据。
判断模块630,用于判断接收第二广播数据的心跳是否超时。
替换模块640,用于若接收第二广播数据的心跳超时,则替换原始主节点电子设备成为更新主节点电子设备。
以及守护模块650,用于对其他电子设备进行监测以实现对其他电子设备的守护。
请继续参照图6,一种可选的实施方式中,程序守护装置还包括如下模块:
保持模块,用于若接收第二广播数据的心跳未超时,则继续保持当前电子设备为从节点电子设备。
上述接收模块620还用于,从第二广播数据获取、并存储来自电子设备的实时状态信息。
请继续参照图6,一种可选的实施方式中,上述替换模块640具体用于,将当前电子设备设置为更新主节点电子设备,并向通信网发送第三广播数据;其中,第三广播数据包含:用于声明当前电子设备成为更新主节点电子设备的第一声明信息;接收通信网中的第四广播数据;判断第四广播数据是否包含用于声明其他电子设备成为更新主节点电子设备的第二声明信息;若否,则从第四广播数据中获取、并存储其他电子设备的实时状态信息;若是,则判断第一声明信息是否满足预设条件;其中,预设条件包括:第三广播数据的数据帧身份标识号大于第四广播数据的数据帧标识号;若是,若否,则将当前电子设备重新设置为从节点电子设备则将当前电子设备设置为更新主节点电子设备;若否,则将当前电子设备重新设置为从节点电子设备,并从第四广播数据中获取、并存储其他电子设备的实时状态信息。
请继续参照图6,一种可选的实施方式中,上述守护模块650具体用于,向通信网发送第五广播数据;其中,第五广播数据包括心跳包数据;接收来自通信网的第一广播数据;其中,第一广播数据来自其他电子设备;以及根据第一广播数据判断其他电子设备是否存在异常状况;若是,则根据恢复步骤处理异常状况。
请继续参照图6,一种可选的实施方式中,上述第一广播数据包括心跳包数据;上述守护模块650具体执行的第一恢复步骤包括如下第一恢复步骤:判断接收第一广播数据的心跳是否超时;若判定接收的第一广播数据的心跳超时,则确认其他电子设备中的目标应用程序挂死;利用远程复位程序对目标应用程序进行重启,并进一步判断对目标应用程序进行重启的次数是否超过预设的次数阈值;若判定对目标应用程序进行重启的次数超过预设的次数阈值,则利用远程复位程序启动其他电子设备中的目标应用程序相应的备用程序。
请继续参照图6,一种可选的实施方式中,上述第一广播数据包括目标应用程序的路径信息;上述守护模块650具体用于,利用远程复位程序根据路径信息启动其他电子设备中的目标应用程序相应的备份程序。
请继续参照图6,一种可选的实施方式中,上述守护模块650执行的恢复步骤具体包括如下第二恢复步骤:解析第一广播数据,获得其他电子设备中的目标应用程序的实时状态信息;判断实时状态信息是否超过预设门限值;若判定实时状态信息超过预设门限值,则确认其他电子设备中的目标应用程序存在异常;处理异常以使其他电子设备中的目标应用程序恢复正常。
请继续参照图6,一种可选的实施方式中,上述守护模块650执行的恢复步骤具体包括:检测其他电子设备中的目标应用程序是否成功恢复正常;若判定其他电子设备中的目标应用程序未恢复正常,则输出用以提示人工处理的预警信息。
应理解的是,该装置与上述的应用程序守护方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。
本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (10)

1.一种应用程序守护方法,其特征在于,应用于通信网中的电子设备;所述方法包括:
从节点电子设备向所述通信网发送第一广播数据;
接收来自所述通信网的第二广播数据;其中,所述第二广播数据来自原始主节点电子设备、并包括心跳包数据;
判断接收所述第二广播数据的心跳是否超时;
若接收所述第二广播数据的心跳超时,则替换所述原始主节点电子设备成为更新主节点电子设备;以及
对其他电子设备进行监测以实现对所述其他电子设备中目标应用程序的守护。
2.根据权利要求1所述的应用程序守护方法,其特征在于,所述方法还包括:
若接收所述第二广播数据的心跳未超时,则继续保持当前电子设备为从节点电子设备;以及
从所述第二广播数据获取、并存储来自所述电子设备的实时状态信息。
3.根据权利要求1所述的应用程序守护方法,其特征在于,所述替换所述原始主节点电子设备成为主节点电子设备,包括:
将当前电子设备设置为更新主节点电子设备,并向所述通信网发送第三广播数据;其中,所述第三广播数据包含:用于声明所述当前电子设备成为更新主节点电子设备的第一声明信息;
接收通信网中的第四广播数据;
判断所述第四广播数据是否包含用于声明所述其他电子设备成为更新主节点电子设备的第二声明信息;
若判定所述第四广播数据不包含所述第二声明信息,则从所述第四广播数据中获取、并存储所述其他电子设备的实时状态信息;
若判定所述第四广播数据包含所述第二声明信息,则进一步判断所述第一声明信息是否满足预设条件;其中,所述预设条件包括:所述第三广播数据的数据帧身份标识号大于所述第四广播数据的数据帧标识号;
若判定所述第三广播数据的数据帧身份标识号大于所述第四广播数据的数据帧标识号,则将当前电子设备重新设置为从节点电子设备,否则将当前电子设备设置为更新主节点电子设备;
若判定所述第三广播数据的数据帧身份标识号不大于所述第四广播数据的数据帧标识号,则将当前电子设备重新设置为从节点电子设备,并从所述第四广播数据中获取、并存储所述其他电子设备的实时状态信息。
4.根据权利要求1所述的应用程序守护方法,其特征在于,所述对其他电子设备进行监测以实现对所述其他电子设备的守护,包括:
向所述通信网发送第五广播数据;其中,所述第五广播数据包括心跳包数据;
接收来自所述通信网的第一广播数据;其中,所述第一广播数据来自所述其他电子设备;以及
根据所述第一广播数据判断所述其他电子设备是否存在异常状况;
若判定所述其他电子设备存在异常状况,则根据恢复步骤处理所述异常状况。
5.根据权利要求4所述的应用程序守护方法,其特征在于,其中,所述第一广播数据包括心跳包数据;所述恢复步骤包括如下第一恢复步骤:
判断接收所述第一广播数据的心跳是否超时;
若判定接收的所述第一广播数据的心跳超时,则确认所述其他电子设备中的目标应用程序挂死;
利用远程复位程序对所述目标应用程序进行重启,并进一步判断所述对所述目标应用程序进行重启的次数是否超过预设的次数阈值;
若判定所述对所述目标应用程序进行重启的次数超过预设的次数阈值,则利用所述远程复位程序启动所述其他电子设备中的目标应用程序相应的备用程序。
6.根据权利要求5所述的应用程序守护方法,其特征在于,其中,所述第一广播数据包括所述目标应用程序的路径信息;
所述利用所述远程复位程序启动所述其他电子设备中的目标应用程序相应的备用程序,包括:
利用所述远程复位程序根据所述路径信息启动所述其他电子设备中的目标应用程序相应的备份程序。
7.根据权利要求4所述的应用程序守护方法,其特征在于,其中,所述恢复步骤包括如下第二恢复步骤:
解析所述第一广播数据,获得所述其他电子设备中的目标应用程序的实时状态信息;
判断所述实时状态信息是否超过预设门限值;
若判定所述实时状态信息超过预设门限值,则确认所述其他电子设备中的目标应用程序存在异常;
处理所述异常以使所述其他电子设备中的目标应用程序恢复正常。
8.根据权利要求7所述的应用程序守护方法,其特征在于,所述处理所述异常以使所述其他电子设备中的目标应用程序恢复正常之后,所述方法还包括:
检测所述其他电子设备中的目标应用程序是否成功恢复正常;
若判定所述其他电子设备中的目标应用程序未恢复正常,则输出用以提示人工处理的预警信息。
9.一种应用程序守护装置,其特征在于,应用于通过通信连接形成通信网的若干电子设备;所述装置包括:
发送模块,用于将当前电子设备设置为从节点电子设备,并向所述通信网发送第一广播数据;
接收模块,用于接收来自所述通信网的第二广播数据;其中,所述第二广播数据来自原始主节点电子设备、并包括心跳包数据;
判断模块,用于判断接收所述第二广播数据的心跳是否超时;
替换模块,用于若接收所述第二广播数据的心跳超时,则替换所述原始主节点电子设备成为更新主节点电子设备;以及
守护模块,用于对其他电子设备进行监测以实现对所述其他电子设备的守护。
10.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一所述的方法。
CN202211159117.5A 2022-09-22 2022-09-22 一种应用程序守护方法、装置及存储介质 Active CN115514689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211159117.5A CN115514689B (zh) 2022-09-22 2022-09-22 一种应用程序守护方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211159117.5A CN115514689B (zh) 2022-09-22 2022-09-22 一种应用程序守护方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN115514689A true CN115514689A (zh) 2022-12-23
CN115514689B CN115514689B (zh) 2024-04-02

Family

ID=84505377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211159117.5A Active CN115514689B (zh) 2022-09-22 2022-09-22 一种应用程序守护方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115514689B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050237926A1 (en) * 2004-04-22 2005-10-27 Fan-Tieng Cheng Method for providing fault-tolerant application cluster service
CN102724065A (zh) * 2012-05-22 2012-10-10 长沙中联消防机械有限公司 一种网络通信系统及包括该系统的工程机械设备
US20140237095A1 (en) * 2013-02-18 2014-08-21 Comcast Cable Communications, Llc Data Center Node Management
CN106021005A (zh) * 2016-05-10 2016-10-12 北京金山安全软件有限公司 一种提供应用业务的方法、装置及电子设备
WO2016197876A1 (zh) * 2015-06-11 2016-12-15 阿里巴巴集团控股有限公司 远程控制方法、远程服务器、管理设备和终端
CN106911728A (zh) * 2015-12-22 2017-06-30 华为技术服务有限公司 分布式系统中主节点的选取方法和装置
CN108255646A (zh) * 2018-01-17 2018-07-06 重庆大学 一种基于心跳检测的工控应用程序故障自恢复的方法
CN112187542A (zh) * 2020-09-28 2021-01-05 深圳市玄羽科技有限公司 数据通信的集群方法及系统
CN112631820A (zh) * 2020-12-30 2021-04-09 山石网科通信技术股份有限公司 软件系统的故障恢复方法及装置
CN112911520A (zh) * 2019-12-04 2021-06-04 哈尔滨海能达科技有限公司 自组网中确定主节点的方法、装置及存储介质
CN114791835A (zh) * 2022-03-16 2022-07-26 青岛海尔科技有限公司 程序重启方法及装置、存储介质及电子装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050237926A1 (en) * 2004-04-22 2005-10-27 Fan-Tieng Cheng Method for providing fault-tolerant application cluster service
CN102724065A (zh) * 2012-05-22 2012-10-10 长沙中联消防机械有限公司 一种网络通信系统及包括该系统的工程机械设备
US20140237095A1 (en) * 2013-02-18 2014-08-21 Comcast Cable Communications, Llc Data Center Node Management
WO2016197876A1 (zh) * 2015-06-11 2016-12-15 阿里巴巴集团控股有限公司 远程控制方法、远程服务器、管理设备和终端
CN106911728A (zh) * 2015-12-22 2017-06-30 华为技术服务有限公司 分布式系统中主节点的选取方法和装置
CN106021005A (zh) * 2016-05-10 2016-10-12 北京金山安全软件有限公司 一种提供应用业务的方法、装置及电子设备
CN108255646A (zh) * 2018-01-17 2018-07-06 重庆大学 一种基于心跳检测的工控应用程序故障自恢复的方法
CN112911520A (zh) * 2019-12-04 2021-06-04 哈尔滨海能达科技有限公司 自组网中确定主节点的方法、装置及存储介质
CN112187542A (zh) * 2020-09-28 2021-01-05 深圳市玄羽科技有限公司 数据通信的集群方法及系统
CN112631820A (zh) * 2020-12-30 2021-04-09 山石网科通信技术股份有限公司 软件系统的故障恢复方法及装置
CN114791835A (zh) * 2022-03-16 2022-07-26 青岛海尔科技有限公司 程序重启方法及装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN115514689B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
US10491671B2 (en) Method and apparatus for switching between servers in server cluster
CN108255646B (zh) 一种基于心跳检测的工控应用程序故障自恢复的方法
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
CN111459770A (zh) 服务器运行状态的告警方法、装置、服务器及存储介质
CN110659159A (zh) 一种服务进程运行监控方法、装置、设备及存储介质
CN105550057B (zh) 嵌入式软件系统故障检测恢复方法和系统
CN110618864A (zh) 一种中断任务恢复方法及装置
CN110943855A (zh) 一种通过bmc实现服务器宕机后状态恢复的方法
CN110933142A (zh) 一种icfs集群网卡监控方法、装置和设备及介质
CN111143099A (zh) 一种bmc进程监控方法及装置
CN108737153B (zh) 区块链灾备系统、方法、服务器和计算机可读存储介质
CN112860408A (zh) 一种云真机中的进程保活方法、装置、系统及存储介质
CN106874126A (zh) 一种软件开发中主进程异常检测方法
CN111371642B (zh) 网卡故障检测方法、装置、设备及存储介质
CN115514689A (zh) 一种应用程序守护方法、装置及存储介质
JP2016066303A (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN107896176B (zh) 一种计算节点的处理方法、智能终端及存储介质
CN107179911B (zh) 一种重启管理引擎的方法和设备
CN112463348B (zh) 一种定时任务处理方法及装置
WO2014040470A1 (zh) 告警消息的处理方法及装置
JP2005267434A (ja) アプリケーション監視装置、そのプログラム、及びその記録媒体。
CN110597609A (zh) 一种集群迁移与自动恢复方法及系统
CN113742120B (zh) 一种kdump触发方法、系统、设备以及介质
CN114257498B (zh) 通信系统、用于检测通信系统冗余失效的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant