CN114385405A - 一种实现服务器重启原因记录的方法、装置、系统 - Google Patents

一种实现服务器重启原因记录的方法、装置、系统 Download PDF

Info

Publication number
CN114385405A
CN114385405A CN202210072342.9A CN202210072342A CN114385405A CN 114385405 A CN114385405 A CN 114385405A CN 202210072342 A CN202210072342 A CN 202210072342A CN 114385405 A CN114385405 A CN 114385405A
Authority
CN
China
Prior art keywords
restart
bit
setting
register
identification register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210072342.9A
Other languages
English (en)
Inventor
芦飞
艾山彬
王优博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210072342.9A priority Critical patent/CN114385405A/zh
Publication of CN114385405A publication Critical patent/CN114385405A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明属于重启日志记录技术领域,具体提供一种实现服务器重启原因记录的方法、装置、系统,所述方法包括如下步骤:在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;根据不同的重启行为,将重启标识寄存器对应的位置位;在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。在BMC的存储区域设置重启记录寄存器进行区分常见的重启机制,同时每种机制如何记录到对应位,利用对应的位设置和BIOS里面的处理逻辑进行区分并在BMC SEL进行记录。以给研发测试及维护处理重启测试过程以及重启故障分析进一步的数据支持,提高了研发效率,减少了研发和测试的成本。

Description

一种实现服务器重启原因记录的方法、装置、系统
技术领域
本发明涉及重启日志记录技术领域,具体涉及一种实现服务器重启原因记录的方法、装置、系统。
背景技术
随着服务器技术应用的不断推广与发展,性能、功能以及易用性都在不断增强。服务器日志的记录对于研发、测试及维护人员的管理上是非常关键的。其中,服务器的重启原因的日志记录是相当重要的。
方案1:服务器不进行记录,对于服务器性能没有影响,只是对于重启的数据获取或者异常重启的故障分析带来一定的困难,影响效率。方案2:常见的不同的重启的机制分别不同的处理方式进行记录,如Chassis Control command触发的重启和非ChassisControl触发的重启无法进行区分,若是执行Chassis Control command触发的重启,需要在单位时间内进行Chassis power reset命令才能正确执行,需要和别的重启行为在操作上进行限制。
对于目前常见的两种方案介绍可以看到,要么对于重启的数据获取或者异常重启的故障分析带来一定的困难,影响效率;要么是在处理记录的方式上不统一还存在操作上的限制。这些方式均增加了研发和测试的成本。
发明内容
为了解决没有日志以及记录处理过程中记录策略分散,提高可操作性和灵活性,增加开发效率,本文提出了一种基于BMC实现常见重启原因的记录方法。
本发明的技术方案是:
第一方面,本发明技术方案提供一种实现服务器重启原因记录的方法,包括如下步骤:
在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
根据不同的重启行为,将重启标识寄存器对应的位置位;
在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
优选地,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是触发电源按钮重启时,具体步骤包括:
检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;
检测到状态寄存器置位信息时,将重启标识寄存器对应的位置位。
优选地,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是开机看门狗重启时,具体步骤包括:
当开机触发定时器超时时,将重启标识寄存器对应的位置位。
优选地,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为时控制AC上电重启时,具体步骤包括:
当控制AC上电正常工作时,在执行每次关机前将重启标识寄存器对应的位置位。
优选地,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是主板控制命令触发重启时,具体步骤包括:
检测到在设定的时间内执行完主板重启动作的同时将重启标识寄存器对应的位置位。
优选地,当重启行为是主板控制命令触发重启时,在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因的步骤包括:
启动过程中BIOS读取重启标识寄存器对应位的值,判断该位的值是否为1;
若是,获取引导标识及dev;
判断引导标识有效后发送清除标识的命令给BMC;
BMC读取重启标识寄存器该位的值并在SEL日志记录启动的原因;
若否,结束。
第二方面,本发明技术方案还提供一种实现服务器重启原因记录的装置,包括重启标识寄存器设置模块、重启标识寄存器置位模块、日志记录模块;
重启标识寄存器设置模块,用于在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
重启标识寄存器置位模块,用于根据不同的重启行为,将重启标识寄存器对应的位置位;
日志记录模块,用于在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
优选地,该装置还包括电源按钮状态检测模块;
电源按钮状态检测模块,用于检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;
重启标识寄存器置位模块,用于检测到状态寄存器置位信息时,设置重启标识寄存器对应的位的值;还用于当开机触发定时器超时时,设置重启标识寄存器对应的位的值;还用于当控制AC上电正常工作时,在执行每次关机前设置重启标识寄存器对应的位的值;还用于检测到在设定的时间内执行完主板重启动作的同时设置重启标识寄存器对应的位的值。
第三方面,本发明技术方案还提供一种实现服务器重启原因记录的系统,包括BMC;
在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
BMC,用于根据不同的重启行为,设置重启标识寄存器对应的位的值;还用于在启动过程中读取重启标识寄存器对应位的值并记录该位对应的重启原因。
优选地,所述系统还包括BIOS和CPLD;
CPLD,用于检测按钮的硬件Pin的状态变化,并将对应的状态寄存器置位;
BMC,检测CPLD对应状态寄存器置位信息,并设置重启标识寄存器对应的位的值;
BIOS,用于启动过程中读取重启标识寄存器对应位的值,判断该位的值是否为1;若是,获取引导标识及dev;判断引导标识有效后发送清除标识的命令给BMC。
从以上技术方案可以看出,本发明具有以下优点:在BMC的存储区域设置重启记录寄存器进行区分常见的重启机制,同时每种机制如何记录到对应位,利用对应的位设置和BIOS里面的处理逻辑进行区分并在BMC SEL进行记录。以给研发测试及维护处理重启测试过程以及重启故障分析进一步的数据支持,提高了研发效率,减少了研发和测试的成本。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明另一个实施例的方法的示意性流程图。
图3是本发明再一个实施例的方法的示意性流程图。
图4是本发明一个实施例的装置的示意性框图。
具体实施方式
常见的不同的重启的机制分别不同的处理方式进行记录,如触发电源按钮重启,BMC会设置巡检代码不断检测电源按钮的硬件PIN的状态进行记录;开机看门狗,利用BIOS给BMC设定的timer,当timeout时生成日志;主板(也可以是机箱)控制命令触发的重启和非主板(也可以是机箱)控制命令触发的重启无法进行区分,若是执行主板控制命令触发的重启,需要在单位时间内进行主板电源重启Chassis power reset命令才能正确执行,需要和别的重启行为在操作上进行限制。对于目前常见的两种方案介绍可以看到,要么对于重启的数据获取或者异常重启的故障分析带来一定的困难,影响效率;要么是在处理记录的方式上不统一还存在操作上的限制。这些方式均增加了研发和测试的成本。为了解决没有日志以及记录处理过程中记录策略分散,提高可操作性和灵活性,增加开发效率,本文提出了一种基于BMC实现常见重启原因的记录方法。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1所示,本发明实施例提供一种实现服务器重启原因记录的方法,包括如下步骤:
步骤1:在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
步骤2:根据不同的重启行为,将重启标识寄存器对应的位置位;
步骤3:在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
在BMC的存储区域设置一个重启标识寄存器Sysrestart Cause的2个byte,其中每个bit标识不同的重启原因,在S0(正常工作)或者S5(关机)下,机器触发重启的原因经过处理过后将重启标识寄存器对应的bit置起,启动过程中,BMC读取到不同的bit后,在SEL日志里面记录下来对应的启动原因。
常见的重启机制包括Power Button电源按钮重启、Watchdog看门狗重启、PowerPolicy控制AC上电重启、Chassis Control command主板控制命令触发重启、非ChassisControl reset(非主板控制重启);
在有些实施例中,重启行为是触发电源按钮重启时,具体将重启标识寄存器对应的位置位的步骤包括:检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;检测到状态寄存器置位信息时,将重启标识寄存器对应的位置位。在S5状态下有短按电源按钮开机的行为,CPLD会检测到Button Pin的状态变化会记录下来,BMC会检测到CPLD对应寄存器的值设置到Sysrestart Cause的对应bit,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因。
在有些实施例中,重启行为是开机看门狗重启时将重启标识寄存器对应的位置位的步骤具体包括:当开机触发定时器超时时,将重启标识寄存器对应的位置位。
对于开机Watchdog,在BMC里面有个watchdog timer机制用于BIOS开机是否在指定的时间内开机是否正常,BIOS开机早期设置具体的time以及timeout后watchdog timer机制需要采取的重启机制。当开机触发timeout时,该timer会设置到Sysrestart Cause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因。
在有些实施例中,重启行为时控制AC上电重启时将重启标识寄存器对应的位置位的步骤具体包括:当控制AC上电正常工作时,在执行每次关机前将重启标识寄存器对应的位置位。
对于Power Policy,一般是用于控制AC reboot上电进入S5还是S0,该策略可由BMC来设置,当设置为AC上电为S0的行为时,可以在执行每次关机前设置到SysrestartCause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因。
在有些实施例中,重启行为是主板控制命令触发重启时将重启标识寄存器对应的位置位的步骤具体包括:检测到在设定的时间内执行完主板重启动作的同时将重启标识寄存器对应的位置位。
对于Chassis Control command控制的引导的机制有点特殊,正常的流程是带外IPMI执行Chassis Control command命令给到BMC,BMC会专门有个寄存器用于记录下次引导是否有效的boot flag以及下次引导采用的策略boot dev,但是该内容下次引导生效需要在IMPI Spec要求的60s内执行Chassis reset动作才行,否则boot flag会被clear,然后BIOS在下次重启过程中首先获取boot flag是否有效,若有效就获取boot dev,按照bootdev执行引导。由于有这个时间以及Chassis reset动作要求,当在60s内在OS下执行了非Chassis reset动作的reboot行为时BMC不知道机器是否发生了重启,这时boot flag及dev也是有效,下次重启时BIOS还是按照Chassis Control进行引导的,这样就会误导的研发或者测试人员,因此需要识别下。因此,在60s内执行完Chassis reset动作同时设置Sysrestart Cause的对应bit。
相应的,在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因的步骤包括:
启动过程中BIOS读取重启标识寄存器对应位的值,判断该位的值是否为1;
若是,获取引导标识及dev;
判断引导标识有效后发送清除标识的命令给BMC;
BMC读取重启标识寄存器该位的值并在SEL日志记录启动的原因;
若否,结束。
也就是,重启过程中BIOS会先判断该bit是否为1,若是1才去获取及判断bootflag及dev,若有效才发送clear flag的命令给BMC,同时BMC在SEL日志记录下启动的原因;若是BIOS会先判断该bit是否为1,若非1,则BIOS不去获取及判断boot flag及dev,就会避免了在60s内在OS下执行了非Chassis reset动作的reboot行为。
另外,如图2所示,本发明实施例还提供一种实现服务器重启原因记录的方法,包括如下步骤:
S1:在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
S2:CPLD检测电源按钮的硬件Pin的状态;
S3:判断状态是否变化,若是,执行步骤S4,否则执行步骤S6;
S4:CPLD将对应的状态寄存器置位;
S5:BMC检测到状态寄存器置位信息时,将重启标识寄存器对应的位置位;执行步骤S13;
S6:检测是否触发定时器超时,若是,执行S14,若否,执行步骤S7;
S7:控制AC上电是否正常工作,若是,在执行每次关机前执行步骤S14,否则执行步骤S8;
S8:检测在设定的时间内是否执行完主板重启动作,若是,执行步骤S9,否则,执行S15;
S9:将重启标识寄存器对应的位置位;执行步骤S10;
S10:启动过程中BIOS读取重启标识寄存器对应位的值,判断该位的值是否为1;若是,执行步骤S11,否则,执行S15;
S11:获取引导标识及dev;
S12:判断引导标识有效后发送清除标识的命令给BMC;
S13:BMC读取重启标识寄存器该位的值并在SEL日志记录启动的原因;执行步骤S15;
S14:将重启标识寄存器对应的位置位;执行步骤S13;
S15:结束。
另外,如图3所示,本发明实施例还提供一种实现服务器重启原因记录的方法,包括如下步骤:
SS1:在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
SS21:CPLD检测电源按钮的硬件Pin的状态;当检测到状态变化时,CPLD将对应的状态寄存器置位;
SS22:BMC检测到状态寄存器置位信息时,将重启标识寄存器对应的位置位;执行SS7;
SS31:检测触发定时器超时时,将重启标识寄存器对应的位置位;执行SS6;
SS41:控制AC上电正常工作时,在执行每次关机前将重启标识寄存器对应的位置位;执行SS6;
SS51:在设定的时间内执行完主板重启动作的同时将重启标识寄存器对应的位置位;
SS52:启动过程中BIOS读取重启标识寄存器对应位的值,判断该位的值是否为1;若是,执行步骤SS53,否则,执行SS7;
SS53:获取引导标识及dev;
SS54:判断引导标识有效后发送清除标识的命令给BMC;执行SS6;
SS6:BMC读取重启标识寄存器该位的值并在SEL日志记录启动的原因;执行SS7;
SS7:结束。
如图4所示,本发明实施例还提供一种实现服务器重启原因记录的装置,包括重启标识寄存器设置模块、重启标识寄存器置位模块、日志记录模块;
重启标识寄存器设置模块,用于在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
重启标识寄存器置位模块,用于根据不同的重启行为,将重启标识寄存器对应的位置位;
日志记录模块,用于在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
需要说明的是,常见的重启机制包括Power Button电源按钮重启、Watchdog看门狗重启、Power Policy控制AC上电重启、Chassis Control command主板控制命令触发重启、非Chassis Control reset(非主板控制重启);
该装置还包括电源按钮状态检测模块;
电源按钮状态检测模块,用于检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;
重启标识寄存器置位模块,用于检测到状态寄存器置位信息时,设置重启标识寄存器对应的位的值;还用于当开机触发定时器超时时,设置重启标识寄存器对应的位的值;还用于当控制AC上电正常工作时,在执行每次关机前设置重启标识寄存器对应的位的值;还用于检测到在设定的时间内执行完主板重启动作的同时设置重启标识寄存器对应的位的值。
对于Power Button,在S5状态下有短按开机的行为,CPLD会检测到Button Pin的状态变化会记录下来,BMC会检测到CPLD对应寄存器的值设置到Sysrestart Cause的对应bit,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于开机Watchdog,在BMC里面有个watchdog timer机制用于BIOS开机是否在指定的时间内开机是否正常,BIOS开机早期设置具体的time以及timeout后watchdog timer机制需要采取的重启机制。当开机触发timeout时,该timer会设置到Sysrestart Cause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于Power Policy,一般是用于控制AC reboot上电进入S5还是S0,该策略可由BMC来设置,当设置为AC上电为S0的行为时,可以在执行每次关机前设置到SysrestartCause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于Chassis Control command控制的引导的机制有点特殊,正常的流程是带外IPMI执行Chassis Control command命令给到BMC,BMC会专门有个寄存器用于记录下次引导是否有效的boot flag以及下次引导采用的策略boot dev,但是该内容下次引导生效需要在IMPI Spec要求的60s内执行Chassis reset动作才行,否则boot flag会被clear,然后BIOS在下次重启过程中首先获取boot flag是否有效,若有效就获取boot dev,按照bootdev执行引导。由于有这个时间以及Chassis reset动作要求,当在60s内在OS下执行了非Chassis reset动作的reboot行为时BMC不知道机器是否发生了重启,这时boot flag及dev也是有效,下次重启时BIOS还是按照Chassis Control进行引导的,这样就会误导的研发或者测试人员,因此需要识别下。因此,在60s内执行完Chassis reset动作同时设置Sysrestart Cause的对应bit,重启过程中BIOS会先判断该bit是否为1,若是1才去获取及判断boot flag及dev,若有效才发送clear flag的命令给BMC,同时BMC在SEL日志记录下启动的原因;若是BIOS会先判断该bit是否为1,若非1,则BIOS不去获取及判断boot flag及dev,就会避免了在60s内在OS下执行了非Chassis reset动作的reboot行为。
本发明实施例还提供一种实现服务器重启原因记录的系统,包括BMC、BIOS和CPLD;
在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
BMC,用于根据不同的重启行为,设置重启标识寄存器对应的位的值;还用于在启动过程中读取重启标识寄存器对应位的值并记录该位对应的重启原因。
CPLD,用于检测按钮的硬件Pin的状态变化,并将对应的状态寄存器置位;
BMC,检测CPLD对应状态寄存器置位信息,并设置重启标识寄存器对应的位的值;
BIOS,用于启动过程中读取重启标识寄存器对应位的值,判断该位的值是否为1;若是,获取引导标识及dev;判断引导标识有效后发送清除标识的命令给BMC。
对于Power Button,在S5状态下有短按开机的行为,CPLD会检测到Button Pin的状态变化会记录下来,BMC会检测到CPLD对应寄存器的值设置到Sysrestart Cause的对应bit,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于开机Watchdog,在BMC里面有个watchdog timer机制用于BIOS开机是否在指定的时间内开机是否正常,BIOS开机早期设置具体的time以及timeout后watchdog timer机制需要采取的重启机制。当开机触发timeout时,该timer会设置到Sysrestart Cause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于Power Policy,一般是用于控制AC reboot上电进入S5还是S0,该策略可由BMC来设置,当设置为AC上电为S0的行为时,可以在执行每次关机前设置到SysrestartCause的对应bit,然后再采取重启策略,在开机过程中,BMC检测到该位置起来,在SEL日志记录下启动的原因;
对于Chassis Control command控制的引导的机制有点特殊,正常的流程是带外IPMI执行Chassis Control command命令给到BMC,BMC会专门有个寄存器用于记录下次引导是否有效的boot flag以及下次引导采用的策略boot dev,但是该内容下次引导生效需要在IMPI Spec要求的60s内执行Chassis reset动作才行,否则boot flag会被clear,然后BIOS在下次重启过程中首先获取boot flag是否有效,若有效就获取boot dev,按照bootdev执行引导。由于有这个时间以及Chassis reset动作要求,当在60s内在OS下执行了非Chassis reset动作的reboot行为时BMC不知道机器是否发生了重启,这时boot flag及dev也是有效,下次重启时BIOS还是按照Chassis Control进行引导的,这样就会误导的研发或者测试人员,因此需要识别下。因此,在60s内执行完Chassis reset动作同时设置Sysrestart Cause的对应bit,重启过程中BIOS会先判断该bit是否为1,若是1才去获取及判断boot flag及dev,若有效才发送clear flag的命令给BMC,同时BMC在SEL日志记录下启动的原因;若是BIOS会先判断该bit是否为1,若非1,则BIOS不去获取及判断boot flag(引导标识)及dev,就会避免了在60s内在OS下执行了非Chassis reset动作的reboot(重启)行为。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种实现服务器重启原因记录的方法,其特征在于,包括如下步骤:
在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
根据不同的重启行为,将重启标识寄存器对应的位置位;
在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
2.根据权利要求1所述的实现服务器重启原因记录的方法,其特征在于,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是触发电源按钮重启时,具体步骤包括:
检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;
检测到状态寄存器置位信息时,将重启标识寄存器对应的位置位。
3.根据权利要求1所述的实现服务器重启原因记录的方法,其特征在于,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是开机看门狗重启时,具体步骤包括:
当开机触发定时器超时时,将重启标识寄存器对应的位置位。
4.根据权利要求1所述的实现服务器重启原因记录的方法,其特征在于,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为时控制AC上电重启时,具体步骤包括:
当控制AC上电正常工作时,在执行每次关机前将重启标识寄存器对应的位置位。
5.根据权利要求1所述的实现服务器重启原因记录的方法,其特征在于,根据不同的重启行为,将重启标识寄存器对应的位置位的步骤中,重启行为是主板控制命令触发重启时,具体步骤包括:
检测到在设定的时间内执行完主板重启动作的同时将重启标识寄存器对应的位置位。
6.根据权利要求5所述的实现服务器重启原因记录的方法,其特征在于,当重启行为是主板控制命令触发重启时,在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因的步骤包括:
启动过程中BIOS读取重启标识寄存器对应位的值,判断该位的值是否为1;
若是,获取引导标识及dev;
判断引导标识有效后发送清除标识的命令给BMC;
BMC读取重启标识寄存器该位的值并在SEL日志记录启动的原因;
若否,结束。
7.一种实现服务器重启原因记录的装置,其特征在于,包括重启标识寄存器设置模块、重启标识寄存器置位模块、日志记录模块;
重启标识寄存器设置模块,用于在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
重启标识寄存器置位模块,用于根据不同的重启行为,将重启标识寄存器对应的位置位;
日志记录模块,用于在启动过程中读取重启标识寄存器该位的值,并记录该位对应的重启原因。
8.根据权利要求7所述的实现服务器重启原因记录的装置,其特征在于,该装置还包括电源按钮状态检测模块;
电源按钮状态检测模块,用于检测到按钮的硬件Pin的状态变化时,将对应的状态寄存器置位;
重启标识寄存器置位模块,用于检测到状态寄存器置位信息时,设置重启标识寄存器对应的位的值;还用于当开机触发定时器超时时,设置重启标识寄存器对应的位的值;还用于当控制AC上电正常工作时,在执行每次关机前设置重启标识寄存器对应的位的值;还用于检测到在设定的时间内执行完主板重启动作的同时设置重启标识寄存器对应的位的值。
9.一种实现服务器重启原因记录的系统,其特征在于,包括BMC;
在BMC的存储区域设置重启标识寄存器,定义重启标识寄存器不同的位对应不同的重启原因;
BMC,用于根据不同的重启行为,设置重启标识寄存器对应的位的值;还用于在启动过程中读取重启标识寄存器对应位的值并记录该位对应的重启原因。
10.根据权利要求9所述的实现服务器重启原因记录的系统,其特征在于,所述系统还包括BIOS和CPLD;
CPLD,用于检测按钮的硬件Pin的状态变化,并将对应的状态寄存器置位;
BMC,检测CPLD对应状态寄存器置位信息,并设置重启标识寄存器对应的位的值;
BIOS,用于启动过程中读取重启标识寄存器对应位的值,判断该位的值是否为1;若是,获取引导标识及dev;判断引导标识有效后发送清除标识的命令给BMC。
CN202210072342.9A 2022-01-21 2022-01-21 一种实现服务器重启原因记录的方法、装置、系统 Withdrawn CN114385405A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210072342.9A CN114385405A (zh) 2022-01-21 2022-01-21 一种实现服务器重启原因记录的方法、装置、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210072342.9A CN114385405A (zh) 2022-01-21 2022-01-21 一种实现服务器重启原因记录的方法、装置、系统

Publications (1)

Publication Number Publication Date
CN114385405A true CN114385405A (zh) 2022-04-22

Family

ID=81203868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210072342.9A Withdrawn CN114385405A (zh) 2022-01-21 2022-01-21 一种实现服务器重启原因记录的方法、装置、系统

Country Status (1)

Country Link
CN (1) CN114385405A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114924802A (zh) * 2022-05-27 2022-08-19 苏州浪潮智能科技有限公司 基于bmc和bios的系统启动方法、装置设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114924802A (zh) * 2022-05-27 2022-08-19 苏州浪潮智能科技有限公司 基于bmc和bios的系统启动方法、装置设备及介质
CN114924802B (zh) * 2022-05-27 2024-02-09 苏州浪潮智能科技有限公司 基于bmc和bios的系统启动方法、装置设备及介质

Similar Documents

Publication Publication Date Title
CN112948157B (zh) 服务器故障定位方法、装置、系统及计算机可读存储介质
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
US20040034816A1 (en) Computer failure recovery and notification system
US20070234123A1 (en) Method for detecting switching failure
CN110750396B (zh) 一种服务器操作系统兼容性测试方法、装置及存储介质
CN106547653B (zh) 计算机系统故障状态检测方法、装置及系统
CN105389525A (zh) 刀片服务器的管理方法和系统
CN111737064A (zh) 一种bmc系统控制方法、装置、存储介质和计算机设备
CN114116280A (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN114385405A (zh) 一种实现服务器重启原因记录的方法、装置、系统
CN115562895A (zh) 一种电子设备的异常恢复方法和设备
CN116775141A (zh) 异常检测方法、装置、计算机设备及存储介质
US11263083B1 (en) Method and apparatus for selective boot-up in computing devices
JP3824548B2 (ja) 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体
CN110187922A (zh) 设置并验证bios参数的方法、装置、设备及存储介质
CN116737471B (zh) Bios自动切换方法、装置、电子设备及存储介质
CN111488050B (zh) 一种电源监控方法、系统及服务器
CN113608930A (zh) 系统芯片和电子设备
CN101436097B (zh) 电子装置及其唤醒方法
CN111400153A (zh) 一种串口日志的启动方法、装置和计算机可读存储介质
CN114510374A (zh) 一种外设挂载失败自动恢复系统及方法
CN115168146A (zh) 一种异常检测方法和装置
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN114816822A (zh) 一种基于内存故障的服务器管理方法、装置以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220422