CN115858224A - 触发看门狗复位的方法、装置、设备、介质和产品 - Google Patents
触发看门狗复位的方法、装置、设备、介质和产品 Download PDFInfo
- Publication number
- CN115858224A CN115858224A CN202211676912.1A CN202211676912A CN115858224A CN 115858224 A CN115858224 A CN 115858224A CN 202211676912 A CN202211676912 A CN 202211676912A CN 115858224 A CN115858224 A CN 115858224A
- Authority
- CN
- China
- Prior art keywords
- target
- watchdog
- reset
- service
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000006870 function Effects 0.000 claims description 66
- 238000004590 computer program Methods 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 23
- 238000005516 engineering process Methods 0.000 abstract description 14
- 230000002159 abnormal effect Effects 0.000 abstract description 12
- 238000004088 simulation Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000001960 triggered effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000017525 heat dissipation Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请实施例公开了一种触发看门狗复位的方法、装置、设备、介质和产品,利用目标系统下的看门狗服务的配置文件,对看门狗服务自身的配置进行更改,使得看门狗服务将不受目标系统的运行状态影响而持续进行计数,并在计数值达到复位触发阈值时自动发出复位命令,从而实现对看门狗复位功能的触发。通过更改看门狗服务自身的配置,能够优化看门狗复位功能的触发方式,使得复位功能的触发不再依赖于代码文件对系统异常情况的模拟,进而使得看门狗复位触发技术不再局限于系统所配置的编译环境,提高了看门狗复位触发技术的适用性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种触发看门狗复位的方法、装置、设备、介质和产品。
背景技术
看门狗(即看门狗服务)是一种程序监视技术,能够对出现异常的系统进行复位。但系统可能由于某些异常错误无法及时响应看门狗发出的复位命令,故需要使用看门狗复位功能的触发技术,以便测试系统对复位命令的响应情况。
相关技术中,通常是在系统中添加并执行相应的代码文件(如ko文件),模拟系统异常的情况,以触发看门狗复位。但由于系统所配置的编译环境可能不同,需要为不同的编译环境开发集成对应的代码文件,适用性较低。
发明内容
本申请实施例的目的是提供一种触发看门狗复位的方法、装置、设备、介质和产品,可以提高看门狗复位触发技术的适用性。
为解决上述技术问题,第一方面,本申请实施例提供一种触发看门狗复位的方法,包括:
获取目标系统下的看门狗服务的配置文件;
根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数;
通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的。
可选地,所述根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,包括:
修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,所述目标功能为所述看门狗服务对所述目标命令的接收功能;
根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,以禁止所述看门狗服务响应所述目标命令。
可选地,所述获取目标系统下的看门狗服务的配置文件,包括:
获取目标系统下的system-watchdog.service文件,所述目标系统为BMC系统;
所述修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,包括:
从所述system-watchdog.service文件中删除目标代码,得到所述重配置文件,所述目标代码用于执行对所述目标命令的接收操作。
可选地,所述根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,包括:
通过所述目标系统提供的配置服务,控制所述看门狗服务加载所述重配置文件,以关闭所述看门狗服务对目标命令的接收功能。
可选地,在所述目标系统为BMC系统的情况下,所述配置服务为daemon服务。
可选地,在通过所述目标系统接收复位命令之后,所述方法还包括:
测试所述目标系统是否成功响应所述看门狗服务发出的复位命令;
在所述目标系统成功响应所述看门狗服务发出的复位命令的情况下,根据所述配置文件,恢复所述看门狗服务对所述目标命令的响应能力,以使所述看门狗服务响应于接收到的目标命令重新进行计数。
可选地,所述测试所述目标系统是否成功响应所述看门狗服务发出的复位命令,包括:
检测在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统是否存在目标信息,所述目标信息包括:目标日志记录和/或目标串口信息;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统存在目标信息的情况下,判定所述目标系统成功响应所述看门狗服务发出的复位命令;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统不存在目标信息的情况下,判定所述目标系统没有成功响应所述看门狗服务发出的复位命令。
第二方面,本申请实施例还提供了一种触发看门狗复位的装置,所述装置包括:
获取模块,用于获取目标系统下的看门狗服务的配置文件;
配置模块,用于根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数;
接收模块,用于通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的。
第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序以实现如第一方面所述的触发看门狗复位的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现如第一方面所述的触发看门狗复位的方法。
第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现第一方面所述的触发看门狗复位的方法。
由上述技术方案可以看出,利用目标系统下的看门狗服务的配置文件,对看门狗服务自身的配置进行更改,通过去除看门狗服务对目标系统发出的目标命令的响应能力,使得看门狗服务将不受目标系统的运行状态影响(即不受目标系统发出的目标命令的影响)而持续进行计数,并在计数值达到复位触发阈值时自动发出复位命令,从而实现对看门狗复位功能的触发。通过更改看门狗服务自身的配置,能够优化看门狗复位功能的触发方式,使得复位功能的触发不再依赖于代码文件对系统异常情况的模拟,进而使得看门狗复位触发技术不再局限于系统所配置的编译环境,提高了看门狗复位触发技术的适用性。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种触发看门狗复位的方法的实施流程图;
图2为本申请实施例提供的一种触发看门狗复位的实现过程的示意图;
图3为本申请实施例提供的另一种触发看门狗复位的实现过程的示意图;
图4为本申请实施例提供的一种触发看门狗复位的装置的结构示意图;
图5为本申请实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
看门狗(即看门狗服务)是一种程序监视技术,在IPMI(Intelligent PlatformManagement Interface,智能平台管理接口)规范中定义了系统看门狗,专门提供看门狗计时器给BIOS(Basic Input Output System,基本输入输出系统)、OEM(Original EquipmentManufacturer,原始设备制造商)系统等系统使用,以使出现异常的系统能够进行复位。
但系统可能由于忙或出现异常错误等原因不能及时响应看门狗的复位命令,造成该系统所配置的软件服务或硬件设备无法立即复位,以致整个系统服务被中断,将产生无法预估的损失。故需要使用看门狗复位功能的触发技术,主动触发看门狗的复位功能,使得看门狗服务能够对未出现异常情况(即能够正常发出目标命令)的目标系统发送复位命令,以便后续测试系统对复位命令的响应情况,实现对看门狗复位功能的测试,从而保证系统能够被看门狗及时复位。
在看门狗复位测试中,通常是在系统中添加并执行相应的代码文件,模拟系统异常的情况,以触发看门狗发送复位命令,进而测试系统对复位命令的响应情况。
以BMC(Board Manager Controller,基板管理控制器)系统为例,其作为服务器上的基板管理系统,负责服务器的资产信息显示、硬件监控、散热调控、系统配置、远程监控、日志收集、故障诊断、系统维护等重要功能。在对BMC系统下的看门狗进行复位功能触发时,需要先根据BMC系统所配置的编译环境(如编译器的版本),开发集成对应的ko文件(即上述代码文件),再将该ko文件复制到BMC系统目录下执行,以模拟BMC系统出现异常的情况,使得BMC系统无法定时向看门狗发出目标命令以使看门狗的计数值清零,此时看门狗将持续进行计数,并在计数值达到复位触发阈值时,看门狗判定BMC系统出现异常从而触发复位功能,向BMC系统发出复位命令,此时即可测试BMC系统对复位命令的响应情况,实现看门狗复位测试。
然而,系统所配置的编译环境可能不同,每次进行看门狗复位触发时,都需要开发集成对应的代码文件,适配性较低,且需要将代码文件复制到系统目录下执行,操作较为繁琐,难以实现自动化。
针对上述相关技术中存在的问题,本申请对看门狗复位功能的触发方式进行优化,利用系统下的看门狗服务的配置文件,对看门狗服务自身的配置进行更改,使得看门狗服务能够对未出现异常情况(即能够正常发出目标命令)的系统发送复位命令,从而使得复位功能的触发不再依赖于代码文件,降低了系统所配置的编译环境对看门狗复位触发的影响,能够简化看门狗复位触发的操作、提高适用性且易于实现自动化。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的连接存储控制器的方法进行详细地说明。
第一方面,参见图1所示,为本申请实施例所提供的一种触发看门狗复位的方法的实施流程图,该方法可以包括以下步骤:
步骤S101:获取目标系统下的看门狗服务的配置文件。
其中,目标系统可以是BMC系统、操作系统(如Unix操作系统、类Unix操作系统、Windows操作系统)等能够配置看门狗服务的系统。在目标系统为BMC的情况下,该配置文件可以是BMC系统目录下的system-watchdog.service文件。
步骤S102:根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数。
其中,该配置文件可以包含复位触发事件配置(如复位触发阈值的设定)、目标命令的接收功能配置等配置内容。
在具体实施时,通过对配置文件的相关配置内容进行增加或删除,能够去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,例如,可以为看门狗服务额外配置对目标命令的接收周期,或关闭看门狗服务对目标命令的接收功能,以使看门狗服务因无法正常接收目标系统定时发出的目标命令,而无法正常响应该目标命令,进而使得看门狗服务将不受目标系统发出的目标命令影响而持续进行计数,并在计数值达到复位触发阈值时自动触发复位功能。此外,还可以通过修改配置文件,减小复位触发阈值,以减少上述复位触发过程中等待看门狗服务的计数值达到复位触发阈值的时间,提高对看门狗复位功能的触发效率,有利于提高对看门狗复位功能的测试效率。
作为一种可能的实施方式,修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,所述目标功能为所述看门狗服务对所述目标命令的接收功能;根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,以禁止所述看门狗服务响应所述目标命令。
在该实施例中,可以将配置文件中目标功能所对应的配置内容进行删除,或将该目标功能所对应的配置内容中的参数开关置为关闭,得到重配置文件,根据该重配置文件对看门狗服务进行重新配置,从而通过关闭看门狗服务对目标命令的接收功能,以禁止看门狗服务响应目标系统发出的目标命令。
其中,在目标系统为BMC系统的情况下,可以从所述system-watchdog.service文件中删除目标代码,得到所述重配置文件,所述目标代码用于执行对所述目标命令的接收操作。可以理解的是,通过将配置文件中的用于接收目标命令的相应代码段删除,看门狗服务将不再具备对BMC系统发出的目标命令的接收功能,此时,无论BMC系统的运行状态是否正常(即无论BMC系统是否能够定时发出目标命令),看门狗服务都因无法接收目标命令而持续进行计数,这相当于将看门狗服务对BMC系统运行状态的监控能力去除,使得看门狗复位功能的触发将不受BMC系统运行状态的影响,此时看门狗服务将根据设定的复位触发阈值,周期性地触发复位功能。
作为一种可能的实施方式,在得到重配置文件之后,可以通过目标系统提供的配置服务,控制所述看门狗服务加载所述重配置文件,以关闭所述看门狗服务对目标命令的接收功能。
在具体实施时,可以对目标系统预先设置用于加载看门狗服务的相关配置文件的配置服务,该配置服务可以在每次被唤醒时,控制看门狗服务加载一次目标系统下的配置文件(如重配置文件),从而实现对看门狗服务的配置更新;该配置服务也可以设置为启动后在目标系统的后台持续运行,并定期控制看门狗服务加载一次目标系统下的配置文件,从而实现对看门狗服务的定期配置更新,能够提高看门狗复位触发技术的自动化程度;也可以直接使用目标系统自带的系统服务实现对重配置文件的加载,如在所述目标系统为BMC系统的情况下,通过所述BMC提供的daemon服务,控制所述看门狗服务加载所述重配置文件。可以理解的是,考虑到在上述看门狗复位触发的过程中,涉及对看门狗服务的配置更改,为避免对看门狗服务的部分恶意的配置操作,还可以设置对看门狗服务配置的保护机制。例如,可以对看门狗服务的配置文件设置修改权限,在对看门狗服务所对应的存储区域(如寄存器)写入第一密钥数据后,才能获得对该看门狗服务的配置文件的修改权限,在完成对该看门狗服务的配置文件的修改之后,对看门狗服务所对应的存储区域写入第二密钥数据,去除自身对看门狗服务的配置文件的修改权限,从而能够避免外部程序对看门狗服务的恶意配置,且能够避免在对配置文件的修改过程中出现其它程序的同步修改情况而导致逻辑出错。
步骤S103:通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的。
可以理解的是,看门狗服务可以看作一个可以在一定时间内被重置的计数器。当看门狗服务启动后,对应的计数器开始自动计数,经过一定时间,如果没有被重置,计数器溢出(即达到复位触发阈值),看门狗服务就会通过复位命令使系统重启(又称“被狗咬”)。系统正常运行时,需要在看门狗服务允许的时间间隔内向看门狗服务发出目标命令以重置对应的计数器(又称“喂狗”),避免看门狗服务发出复位命令,而本申请通过去除看门狗服务对目标系统发出的目标命令的响应能力,使得在看门狗复位触发过程中,正常运行的目标系统无法对看门狗服务进行“喂狗”,看门狗服务的计数器将持续进行计数,直至计数器溢出,此时目标系统即可收到看门狗服务发出的复位命令,其中,该复位命令可以是用于指示目标系统进行重启或关机等恢复操作的命令。
作为一种可能的实施方式,在通过所述目标系统接收复位命令之后,测试所述目标系统是否成功响应所述看门狗服务发出的复位命令。
在触发看门狗的复位功能之后,可以通过检测目标系统是否执行复位命令所对应的恢复操作(即复位操作),以测试目标系统是否成功响应所述看门狗服务发出的复位命令,在目标系统及时响应了看门狗服务的复位命令时,判定目标系统成功响应看门狗服务发出的复位命令(即看门狗复位测试通过),并结束本次的看门狗复位测试;在目标系统由于忙或出现异常错误等原因未能及时响应看门狗服务的复位命令时,则可判定目标系统没有成功响应看门狗服务发出的复位命令(即看门狗复位测试未通过),此时可将该测试未通过的测试结果以邮件或BMC网页等方式反馈给相关的技术人员,以使技术人员及时对目标系统进行故障排查,恢复看门狗服务对目标系统的复位能力,避免目标系统所配置的软件服务或硬件设备由于无法及时复位而产生无法预估的损失。
作为一种可能的实施方式,检测在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统是否存在目标信息,所述目标信息包括:目标日志记录和/或目标串口信息;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统存在目标信息的情况下,判定所述目标系统成功响应所述看门狗服务发出的复位命令;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统不存在目标信息的情况下,判定所述目标系统没有成功响应所述看门狗服务发出的复位命令。
在该实施例中,在看门狗服务的计数值达到复位触发阈值的同时开始计时,在设定时长(如10秒或半分钟)内检测目标系统是否存在因执行了复位命令所对应的恢复操作而产生的目标信息,如检测目标系统的日志中是否生成了目标记录,该目标记录可以用于描述目标系统因复位命令而重启的事件,或检测目标系统是否打印了目标串口信息,该目标串口信息可以用于描述目标系统因复位命令而执行了断电再开机的恢复操作,从而通过在设定时长内检测所述目标系统是否存在目标信息,实现对目标系统的目标命令响应及时性测试。
作为一种可能的实施方式,在所述目标系统成功响应所述看门狗服务发出的复位命令之后,根据所述配置文件,恢复所述看门狗服务对所述目标命令的响应能力,以使所述看门狗服务响应于接收到的目标命令重新进行计数。
在具体实施时,在判定目标系统成功响应所述看门狗服务发出的复位命令的情况下,则说明看门狗服务的复位功能正常,此时可通过配置文件,将看门狗服务的配置恢复至看门狗复位测试之前的配置,即恢复看门狗服务对目标命令的响应能力,使得看门狗服务能够对目标系统的运行状态进行正常监控。此外,还可以将目标系统下的重配置文件进行备份,以对该看门狗服务定期进行复位功能的测试,从而保证目标系统的可靠运行。
由上述技术方案可以看出,利用目标系统下的看门狗服务的配置文件,对看门狗服务自身的配置进行更改,通过去除看门狗服务对目标系统发出的目标命令的响应能力,使得看门狗服务将不受目标系统的运行状态影响(即不受目标系统发出的目标命令的影响)而持续进行计数,并在计数值达到复位触发阈值时自动发出复位命令,从而实现对看门狗复位功能的触发。通过更改看门狗服务自身的配置,能够优化看门狗复位功能的触发方式,使得复位功能的触发不再依赖于代码文件对系统异常情况的模拟,进而使得看门狗复位触发技术不再局限于系统所配置的编译环境,提高了看门狗复位触发技术的适用性。
以下结合图2,对上述技术方案作进一步说明。如图2所示,以BMC系统为例,本申请实施例提供了一种触发看门狗复位的实现过程,包括:
(1)修改BMC的看门狗服务的配置文件(即server文件)。
在具体实施时,用户(或程序)进入BMC系统,并切换至root用户身份以便对目标系统进行相关操作。如图3所示,修改BMC的看门狗服务的配置文件的过程包括:
打开目标系统目录下的system-watchdog.service文件;
删除server文件中目标代码ExecStopPost=/bin/sh-c"echo V>${{DEVICE}}"所在行的内容,得到修改后的配置文件(即重配置文件)。
(2)停止看门狗服务,并重启daemon服务以通过重启看门狗服务的方式,利用重配置文件更新看门狗服务的配置。
在具体实施时,如图3所示,可以通过systemctl stop system-watchdog命令停止看门狗服务,并通过systemctl daemon-reload命令重启daemon服务,该daemon服务在重启后,能够重启看门狗服务并控制重启后的看门狗服务加载重配置文件,该看门狗服务在重启完成后,将不再接收目标系统发出的目标命令,并持续进行技术,在计数值达到复位触发阈值时,看门狗服务触发复位功能以使BMC系统复位,通过这一手段可以实现对看门狗复位功能的测试。
(3)在BMC系统被看门狗服务成功复位的情况下,对修改后的server文件进行恢复。
在具体实施时,将目标代码所在行的内容写入重配置文件的对应位置,从而将重配置文件恢复为初始的配置文件(即server文件),并再次重启daemon服务以通过重启看门狗服务的方式,利用恢复后的配置文件恢复看门狗服务的配置,使看门狗服务具备对目标命令的接收能力。可以理解的是,在将重配置文件恢复为配置文件之前,可以将重配置文件进行备份,以便后续对该看门狗服务进行复位功能触发,类似地,在将配置文件修改为重配置文件前,也可对配置文件进行备份,以便对看门狗服务的配置进行恢复。
第二方面,本申请实施例提供了一种触发看门狗复位的装置,如图4所示,该装置包括:
获取模块21,用于获取目标系统下的看门狗服务的配置文件;
其中,目标系统可以是BMC系统、操作系统(如Unix操作系统、类Unix操作系统、Windows操作系统)等能够配置看门狗服务的系统。在目标系统为BMC的情况下,该配置文件可以是BMC系统目录下的system-watchdog.service文件。
配置模块22,用于根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数;
其中,该配置文件可以包含复位触发事件配置(如复位触发阈值的设定)、目标命令的接收功能配置等配置内容。
接收模块23,用于通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的;
其中,看门狗服务可以看作一个可以在一定时间内被重置的计数器。当看门狗服务启动后,对应的计数器开始自动计数,经过一定时间,如果没有被重置,计数器溢出(即达到复位触发阈值),看门狗服务就会通过复位命令使系统重启(又称“被狗咬”)。系统正常运行时,需要在看门狗服务允许的时间间隔内向看门狗服务发出目标命令以重置对应的计数器(又称“喂狗”),避免看门狗服务发出复位命令,而本申请通过去除看门狗服务对目标系统发出的目标命令的响应能力,使得在看门狗复位触发过程中,正常运行的目标系统无法对看门狗服务进行“喂狗”,看门狗服务的计数器将持续进行计数,直至计数器溢出,此时目标系统即可收到看门狗服务发出的复位命令,其中,该复位命令可以是用于指示目标系统进行重启或关机等恢复操作的命令。
在具体实施时,通过对配置文件的相关配置内容进行增加或删除,能够去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,例如,可以为看门狗服务额外配置对目标命令的接收周期,或关闭看门狗服务对目标命令的接收功能,以使看门狗服务在复位触发过程中,因无法正常接收目标系统定时发出的目标命令,而无法正常响应该目标命令,进而使得看门狗服务在复位触发过程中将不受目标系统发出的目标命令影响而持续进行计数,并在计数值达到复位触发阈值时自动触发复位功能。
可选地,所述配置模块22包括:
第一配置子模块,用于修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,所述目标功能为所述看门狗服务对所述目标命令的接收功能;
第二配置子模块,用于根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,以禁止所述看门狗服务响应所述目标命令。
可选地,所述获取模块21包括:
获取子模块,用于获取目标系统下的system-watchdog.service文件,所述目标系统为BMC系统;
所述第一配置子模块包括:
第一处理模块,用于从所述system-watchdog.service文件中删除目标代码,得到所述重配置文件,所述目标代码用于执行对所述目标命令的接收操作。
可选地,所述第二配置子模块包括:
第二处理模块,用于通过所述目标系统提供的配置服务,控制所述看门狗服务加载所述重配置文件,以关闭所述看门狗服务对目标命令的接收功能。
可选地,在所述目标系统为BMC系统的情况下,所述配置服务为daemon服务。
可选地,在通过所述目标系统接收复位命令之后,所述装置还包括:
测试模块,用于测试所述目标系统是否成功响应所述看门狗服务发出的复位命令;
第三处理模块,用于在所述目标系统成功响应所述看门狗服务发出的复位命令的情况下,根据所述配置文件,恢复所述看门狗服务对所述目标命令的响应能力,以使所述看门狗服务响应于接收到的目标命令重新进行计数。
可选地,所述测试模块包括:
测试子模块,用于检测在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统是否存在目标信息,所述目标信息包括:目标日志记录和/或目标串口信息;
第一响应模块,用于在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统存在目标信息的情况下,判定所述目标系统成功响应所述看门狗服务发出的复位命令;
第二响应模块,用于在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统不存在目标信息的情况下,判定所述目标系统没有成功响应所述看门狗服务发出的复位命令。
由上述技术方案可以看出,利用目标系统下的看门狗服务的配置文件,对看门狗服务自身的配置进行更改,通过去除看门狗服务对目标系统发出的目标命令的响应能力,使得看门狗服务将不受目标系统的运行状态影响(即不受目标系统发出的目标命令的影响)而持续进行计数,并在计数值达到复位触发阈值时自动发出复位命令,从而实现对看门狗复位功能的触发。通过更改看门狗服务自身的配置,能够优化看门狗复位功能的触发方式,使得复位功能的触发不再依赖于代码文件对系统异常情况的模拟,进而使得看门狗复位触发技术不再局限于系统所配置的编译环境,提高了看门狗复位触发技术的适用性。
需要说明的是,装置实施例与方法实施例相近,故描述的较为简单,相关之处参见方法实施例即可。
本申请实施例还提供了一种电子设备,参照图5,图5是本申请实施例提出的电子设备的示意图。如图5所示,电子设备100包括:存储器110和处理器120,存储器110与处理器120之间通过总线通信连接,存储器110中存储有计算机程序,该计算机程序可在处理器120上运行,进而实现本申请实施例公开的触发看门狗复位的方法中的步骤。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现如本申请实施例公开的所述触发看门狗复位的方法。
本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如本申请实施例公开的所述触发看门狗复位的方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、系统、设备、存储介质及程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种触发看门狗复位的方法、装置、设备、介质和产品,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (11)
1.一种触发看门狗复位的方法,其特征在于,包括:
获取目标系统下的看门狗服务的配置文件;
根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数;
通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,包括:
修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,所述目标功能为所述看门狗服务对所述目标命令的接收功能;
根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,以禁止所述看门狗服务响应所述目标命令。
3.根据权利要求2所述的方法,其特征在于,所述获取目标系统下的看门狗服务的配置文件,包括:
获取目标系统下的system-watchdog.service文件,所述目标系统为BMC系统;
所述修改所述配置文件中目标功能所对应的配置内容,得到重配置文件,包括:
从所述system-watchdog.service文件中删除目标代码,得到所述重配置文件,所述目标代码用于执行对所述目标命令的接收操作。
4.根据权利要求2所述的方法,其特征在于,所述根据所述重配置文件,配置所述看门狗服务对所述目标命令的接收功能关闭,包括:
通过所述目标系统提供的配置服务,控制所述看门狗服务加载所述重配置文件,以关闭所述看门狗服务对目标命令的接收功能。
5.根据权利要求4所述的方法,其特征在于,在所述目标系统为BMC系统的情况下,所述配置服务为daemon服务。
6.根据权利要求1-5任一所述的方法,其特征在于,在通过所述目标系统接收复位命令之后,所述方法还包括:
测试所述目标系统是否成功响应所述看门狗服务发出的复位命令;
在所述目标系统成功响应所述看门狗服务发出的复位命令的情况下,根据所述配置文件,恢复所述看门狗服务对所述目标命令的响应能力,以使所述看门狗服务响应于接收到的目标命令重新进行计数。
7.根据权利要求6所述的方法,其特征在于,所述测试所述目标系统是否成功响应所述看门狗服务发出的复位命令,包括:
检测在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统是否存在目标信息,所述目标信息包括:目标日志记录和/或目标串口信息;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统存在目标信息的情况下,判定所述目标系统成功响应所述看门狗服务发出的复位命令;
在所述看门狗服务的计数值达到复位触发阈值之后的设定时长内,所述目标系统不存在目标信息的情况下,判定所述目标系统没有成功响应所述看门狗服务发出的复位命令。
8.一种触发看门狗复位的装置,其特征在于,所述装置包括:
获取模块,用于获取目标系统下的看门狗服务的配置文件;
配置模块,用于根据所述配置文件,去除所述看门狗服务对所述目标系统发出的目标命令的响应能力,以使所述看门狗服务持续进行计数,所述目标命令用于指示所述看门狗服务重新计数;
接收模块,用于通过所述目标系统接收复位命令,所述复位命令用于指示所述目标系统执行复位操作,所述复位命令是所述看门狗服务在计数值达到复位触发阈值的情况下发出的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1至7中任一项所述的触发看门狗复位的方法。
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至7中任一项所述的触发看门狗复位的方法。
11.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至7中任一项所述的触发看门狗复位的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211676912.1A CN115858224A (zh) | 2022-12-26 | 2022-12-26 | 触发看门狗复位的方法、装置、设备、介质和产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211676912.1A CN115858224A (zh) | 2022-12-26 | 2022-12-26 | 触发看门狗复位的方法、装置、设备、介质和产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115858224A true CN115858224A (zh) | 2023-03-28 |
Family
ID=85654893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211676912.1A Pending CN115858224A (zh) | 2022-12-26 | 2022-12-26 | 触发看门狗复位的方法、装置、设备、介质和产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115858224A (zh) |
-
2022
- 2022-12-26 CN CN202211676912.1A patent/CN115858224A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022198972A1 (zh) | 一种服务器启动过程中的故障定位方法、系统及装置 | |
AU2014399227B2 (en) | Fault Processing Method, Related Apparatus and Computer | |
CN102141947B (zh) | 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统 | |
JP6291248B2 (ja) | ファームウェアアップグレードエラー検出および自動ロールバック | |
US6425093B1 (en) | Methods and apparatuses for controlling the execution of software on a digital processing system | |
CN109670319B (zh) | 一种服务器flash安全管理方法及其系统 | |
US6438709B2 (en) | Method for recovering from computer system lockup condition | |
CN107315656B (zh) | 多内核的嵌入式plc软件恢复方法和plc | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US10921871B2 (en) | BAS/HVAC control device automatic failure recovery | |
CN110647333A (zh) | 固件升级方法及配置成对其中的固件进行升级的设备 | |
CN108897646B (zh) | 一种bios芯片的切换方法及基板管理控制器 | |
TW200426571A (en) | Policy-based response to system errors occurring during os runtime | |
CN111800304A (zh) | 进程运行的监测方法、存储介质和虚拟装置 | |
CN105426263A (zh) | 一种实现金库系统安全运行的方法及系统 | |
US7340594B2 (en) | Bios-level incident response system and method | |
JPH10214208A (ja) | ソフトウェアの異常監視方式 | |
CA2152329C (en) | Apparatus and methods for software rejuvenation | |
CN106909382B (zh) | 输出不同类型系统启动信息的方法及装置 | |
WO2010135966A1 (zh) | 成对冗余结构中器件的升级方法及设备 | |
CN114217925B (zh) | 一种实现异常自动重启的业务程序运行监控方法及系统 | |
CN115858224A (zh) | 触发看门狗复位的方法、装置、设备、介质和产品 | |
CN107273291B (zh) | 一种处理器调试方法及系统 | |
CN113868001B (zh) | 一种内存修复结果的检查方法、系统及计算机存储介质 | |
CN112650610B (zh) | 一种Linux系统崩溃控制方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |