CN102081573B - 用于记录设备重启原因的装置及方法 - Google Patents

用于记录设备重启原因的装置及方法 Download PDF

Info

Publication number
CN102081573B
CN102081573B CN201110026569.1A CN201110026569A CN102081573B CN 102081573 B CN102081573 B CN 102081573B CN 201110026569 A CN201110026569 A CN 201110026569A CN 102081573 B CN102081573 B CN 102081573B
Authority
CN
China
Prior art keywords
cpu
dog
reset signal
reason
restarting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110026569.1A
Other languages
English (en)
Other versions
CN102081573A (zh
Inventor
邓晓勇
王玉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Information Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201110026569.1A priority Critical patent/CN102081573B/zh
Publication of CN102081573A publication Critical patent/CN102081573A/zh
Application granted granted Critical
Publication of CN102081573B publication Critical patent/CN102081573B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/177Initialisation or configuration control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Abstract

本发明公开了一种用于记录设备重启原因的装置及方法。本发明中用于记录设备重启原因的装置,除了包括触发设备全局复位的第一看门狗之外,还包括有第二看门狗。该第二看门狗在设备上电启动之后触发逻辑芯片在存储阵列中记录表示重启原因为掉电重启的数值。因此,可以将设备的的重启原因记录为掉电重启。

Description

用于记录设备重启原因的装置及方法
技术领域
本发明涉及设备事件的记录与管理技术,特别涉及一种用于记录设备重启原因的装置及一种记录设备重启原因的方法。
背景技术
设备在运行过程中会因为某种异常情况而进行重启。通常,设备的重启原因有三类:设备硬件掉电所引起的掉电重启、CPU上运行的软件发生死循环所引起CPU异常重启以及CPU上承载的软件主动执行重启所引起的软件重启。
然而,现有的设备无法记录准确的重启原因。尤其是掉电重启,当掉电导致设备无法工作时,设备无法记录任何信息因此掉电这一信息难以得到记录。由于设备无法记录其重启原因,因此设备重启后无法识别重启原因,有可能导致难以根据设备重启原因准确定位设备故障。
发明内容
有鉴于此,本发明提供了一种用于记录设备重启原因的装置及一种记录设备重启原因的方法,能够记录整机的掉电重启事件。
本发明提供的一种用于记录设备重启原因的装置,所述装置包括CPU,第一看门狗、第二看门狗、逻辑芯片及存储阵列;其中,
所述第一看门狗,用于在设备上电启动之后,输出第一复位信号至所述逻辑芯片以触发设备的全局复位;
所述第二看门狗,用于在设备上电启动之后,输出第二复位信号至所述逻辑芯片以触发记录设备重启原因是掉电重启;
所述逻辑芯片,用于接收所述第一复位信号和所述第二复位信号,根据所述第一复位信号生成CPU复位信号并将所述CPU复位信号输出至所述CPU,根据所述第二复位信号将所述存储阵列中记录的重启原因初始值修改为表示掉电重启的数值。
本发明提供的一种记录设备重启原因的方法包括:
接收第一看门狗和第二看门狗在上电启动后分别输出的第一复位信号和第二复位信号;
根据所述第一复位信号生成并输出CPU复位信号至CPU,以供所述CPU根据所述CPU复位信号进行重启;根据所述第二复位信号将存储阵列中记录的重启原因初始值修改为表示掉电重启的数值,以供所述CPU在启动完成后从所述存储阵列中读取记录的所述表示掉电重启的数值,根据读取的所述表示掉电重启的数值识别设备的重启原因是掉电重启,将存储阵列中记录的所述表示掉电重启的数值设置为所述重启原因初始值。
由上述技术方案可见,本发明中用于记录设备重启原因的装置,除了包括触发设备全局复位的第一看门狗之外,还包括第二看门狗。该第二看门狗在设备上电启动之后,将表示设备重启原因为掉电重启的数值记录于预设的存储阵列中。因此,虽然设备在掉电重启之前无法记录任何信息,但通过第二看门狗在设备上电后的触发逻辑芯片在存储阵列中所作的记录,CPU能够在每次完成复位后读取存储阵列、并以此识别出设备重启原因为掉电重启。而且,CPU在读取存储阵列后还将该存储阵列设置为初始值,从而能够保证每次重启的原因均可被记录。
附图说明
图1为本发明实施例中用于记录整机重启原因的装置的优选示例性结构示意图。
图2为本发明实施例中用于记录整机重启原因的装置的一具体逻辑结构示意图。
图3为本发明实施例中用于记录整机重启原因的装置的另一具体逻辑结构示意图。
图4为本发明实施例中一种记录设备重启原因的方法的流程图。
图5为本发明实施例中另一种记录设备重启原因的方法的流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
图1为本发明实施例中用于记录设备重启原因的装置的优选示例性结构示意图。参见图1,该装置包括:CPU 10、逻辑芯片11、存储阵列12、第一看门狗13以及第二看门狗14。
其中,第一看门狗13用于在设备上电启动之后,输出第一复位信号以触发设备全局复位。
第二看门狗14用于在设备上电启动之后,输出第二复位信号以触发记录设备重启原因是掉电重启。
逻辑芯片11,用于根据第一复位信号生成CPU复位信号,将该CPU复位信号输出至CPU 10,根据第二复位信号将存储阵列12中记录的重启原因初始值修改为表示掉电重启的数值。
CPU 10,用于根据逻辑芯片11输出的CPU复位信号进行重启,并在启动完成后读取存储阵列12中记录的表示掉电重启的数值,根据读取的数值识别设备重启原因是掉电重启,然后将存储阵列12所记录的表示掉电重启的数值重设为该重启原因初始值。
具体的,所述的存储阵列12可以是固化在逻辑芯片11内部的存储阵列。本文所述的“固化的存储阵列”,是指逻辑芯片11依据逻辑程序在其内部构建形成的存储阵列、或称之为具存储功能的逻辑电路,其可以是具有锁存功能的寄存器或其他任一种存储逻辑。由于该逻辑芯片11中的逻辑程序不会由于掉电而丢失,因而该存储阵列中的数据就不会由于掉电而丢失。
此外,所述的存储阵列12还可以是逻辑芯片11的片外存储阵列。
在实际应用中,所述的逻辑芯片11可以为复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device),或者其他类型的逻辑芯片。
下面以CPLD作为逻辑芯片为例对本发明的用于记录设备重启原因的装置进行详细说明。
图2为本发明实施例中用于记录设备重启原因的装置的一种具体逻辑结构示意图。参见图2,本实施例中用于记录设备重启原因的装置包括:CPU20、CPLD 21、第一看门狗22以及第二看门狗23。
其中,CPLD 21内部包括第一喂狗模块211、复位触发模块212、存储阵列213以及修改模块214。
在设备上电启动后,第一看门狗22检测到设备已经启动,则向CPLD 21的复位触发模块212输出第一复位信号RST1,以触发整个设备的全局复位。
复位触发模块212,用于接收第一看门狗22输出的第一复位信号RST1,生成CPU复位信号并将CPU复位信号输出至所述CPU,以控制CPU 20执行重新启动。
CPU 20完成启动后,输出喂狗信号WDI 1至CPLD 21的第一喂狗模块211,以使第一喂狗模块211输出喂狗信号WDI 2至第一看门狗22,从而实现对第一看门狗22的喂狗操作。
也就是说,CPLD 21在CPU 20的控制下向第一看门狗22输出喂狗信号WDI 2。即,CPU 20定期向CPLD 21的第一喂狗模块211输出喂狗信号WDI 1,将第一喂狗模块211中的计数器清零。第一喂狗模块211在其计数器不溢出的情况下定期向第一看门狗22输出喂狗信号WDI 2,将第一看门狗22中的计数器清零,使第一看门狗22中的计数器不会溢出。
在设备上电启动后,第二看门狗23检测到设备已经启动,则向CPLD 21输出第二复位信号RST2,触发CPLD 21的修改模块214将存储阵列213中记录的重启原因初始值修改为表示掉电重启的数值。因此,设备的重启原因被记录为掉电重启。
由于设备上电后,CPLD 21需要对存储阵列213中的重启原因初始值进行修改,因此需要有足够长的时间确保CPLD 21本身上电稳定后可以在正常工作的状态下记录该数值。譬如:第一看门狗22和第二看门狗23可以在系统电源稳定后输出大约200ms的低脉冲。这样,CPLD 21有足够的时间进行记录。
基于上内容,第一看门狗22检测到设备上电后输出第一复位信号RST1以触发设备的全局复位。第二看门狗23监测到设备上电后输出第二复位信号RST2以触发CPLD将重启原因初始值修改成表示掉电重启的数值。在每次启动后,CPU20读取存储阵列213中的重启原因初始值。由于该初始值已经被CPLD21修改成表示掉电重启的数值,所以CPU20在读取存储阵列213该初始值时,从存储阵列213中读取到的是表示掉电重启的数值;CPU20根据读取到的表示掉电重启的数值将设备重启原因识别为掉电重启。之后,CPU20将存储阵列213中记录的该表示掉电重启的数值修改成该初始值。这样,可以继续通过将该初始值修改成其他表示掉电重启原因的数值的方式,记录设备的其他重启原因,进一步通过读取到的其他表示掉电重启原因的数值,识别其他的设备重启原因。由于第二看门狗23通过电平检测的方式输出第二复位信号RST2,因此不需要对第二看门狗23进行喂狗操作。
本实施方式中,第一看门狗22输出的第一复位信号RST1与第二看门狗23输出的第二复位信号RST2同步;或者,第一看门狗22输出的第一复位信号RST1晚于第二看门狗的23输出第二复位信号RST2。
本发明除了能够记录掉电重启事件之外,还可以进一步记录并识别CPU异常重启、和/或软件重启等其他重启原因。
图3为本发明实施例中用于记录设备重启原因的装置的另一具体逻辑结构示意图。参见图3,本实施例的用于记录设备重启原因的装置包括:CPU30、CPLD 31、第一看门狗32、以及第二看门狗33。
其中,CPLD 31包括:第一喂狗模块311、复位触发模块312、存储阵列313以及修改模块314。
当CPU 30处于正常状态时,CPU 30定期向CPLD 31的第一喂狗模块311输出喂狗信号WDI 1,将第一喂狗模块311中的计数器进行清零。第一喂狗模块311收到来自CPU 30的喂狗信号WDI 1,因此第一喂狗模块311中的计数器被定期清零。当CPU 30处于异常状态(如CPU上执行的软件发生死循环)时,CPU 30停止向第一喂狗模块311输出喂狗信号WDI 1。进一步,当第一喂狗模块311的计数器的计数值到达第一阈值时,触发修改模块314将存储阵列313中记录的重启原因初始值修改为表示CPU处于异常状态的数值。修改模块314将存储阵列313中的该初始值修改成表示CPU处于异常状态的数值。由此,设备的重启原因被记录为CPU异常重启。当第一喂狗模块311的计数器的计数值到达第二阈值而溢出时,第一喂狗模块311停止向第一看门狗32输出喂狗信号WDI 2。
由上述描述可知,触发修改存储阵列313中初始值的第一阈值小于并且接近CPLD 31中计数器溢出所需的第二阈值。这样,在第一喂狗模块311在停止向第一看门狗32输出喂狗信号WDI 2之前,先触发修改模块314在存储阵列313中记录表示CPU异常重启的数值。
譬如:第一阈值可以为28秒,第二阈值可以为30秒。第一喂狗模块311中的计数器每秒钟加1,当该计数器的计数值到达28时,第一喂狗模块311触发修改模块314对存储阵列313中表示设备重启原因的初始值进行修改;当该计数器的计数值到达30时,计数器溢出,即溢出时间为30秒。因此,第一喂狗模块311在未收到来自CPU 30的喂狗信号WDI 1的时间到达28秒时,触发修改模块314修改存储阵列313中记录的重启原因的初始值。当第一喂狗模块311未收到喂狗信号WDI 1的时间到达30秒时,则第一喂狗模块311停止向第一看门狗32输出喂狗信号WDI 2。
设备上电之后,第一看门狗32输出第一复位信号至所述复位触发模块312以触发设备的全局复位并且接收来自所述第一喂狗模块311的喂狗信号WDI 2。当第一看门狗32在溢出时间内没有收到喂狗信号WDI 2时,第一看门狗32向CPLD 31的复位触发模块312输出第一复位信号RST1,第一看门狗32溢出并且输出第一复位信号RST1至所述复位触发模块312。
复位触发模块312接收第一看门狗32输出的第一复位信号RST1,生成并输出CPU复位信号至CPU 30,以控制CPU 30的重新启动。
CPU 30每次完成启动后,读取存储阵列313中记录的表示设备重启原因的数值。由于该初始值已经被修改为表示CPU异常重启(CPU处于异常状态)的数值,CPU 30完成启动之后从存储阵列313读取到的将是表示CPU异常重启的数值,CPU 30根据读取的数值识别设备的重启原因是CPU异常重启。之后,CPU 30将存储阵列313中记录的表示CPU异常重启的数值设置为初始值。
图3所示的其他部件或模块的其他功能与图2中对应的部件或模块相同,在此不再赘述。
另外,图3所示的装置可以进一步识别设备的重启原因是软件重启。此时,CPU 30上所承载的软件能够主动重启。这些软件的重启会导致CPU 30也进行重启。由于CPU重启的时间短,并且修改存储阵列中存储的该初始值的时间接近第一喂狗模块311的溢出时间,因此CPU重启时间小于上述第一阈值。CPU 30重启之后,CPU 30会在该初始值被修改之前,继续输出上述喂狗信号WDI 1至第一喂狗模块311(第一喂狗模块31不会触发该修改模块314修改存储阵列314中的初始值)。CPU 30从存储阵列314中读取该初始值,并根据读取的初始值识别设备的重启原因是软件重启。
这样,除了记录并识别设备的掉电重启之外,本发明实施例还可进一步记录并识别CPU异常重启、和/或软件重启等其他重启原因。从而能够准确地区分这几类的设备重启原因,以便准确定位设备故障的准确定位。
对于需要记录多种重启原因的情况,本发明实施例如图2和图3中所示出的CPLD内的存储阵列可以包括可锁存至少2比特数据的寄存器。
以位宽为2比特的寄存器为例,假设该寄存器的2比特的初始值为“11”,则:
当设备上电重启后,第二看门狗触发CPLD中的修改模块将存储阵列中寄存器锁存的表示设备重启原因的初始值“11”修改为数值为“00”,用于表示设备重启原因为掉电重启。
当设备中CPU工作异常而停止向CPLD中的第一喂狗模块输出喂狗信号的时间到达第一阈值时,CPLD中的修改模块将存储阵列中寄存器锁存的表示设备重启原因的初始值“11”修改数值“10”,用于表示设备重启原因为CPU异常重启。
当软件异常时,存储阵列中寄存器存储的表示设备重启原因的初始值“11”未被改变,用于CPU在重启后根据从寄存器中读取的初始值识别设备重启原因为软件重启。
对应本发明实施例所提供的装置,本发明实施例进一步提供了一种记录设备重启原因的方法。
图4为本发明实施例中一种记录设备重启原因的方法的流程图。如图4所示,该方法包括以下步骤。
步骤401,设备上电启动后,第一看门狗和第二看门狗分别输出第一复位信号和第二复位信号至CPLD。
步骤402,CPLD接收该第一和第二复位信号,根据第一复位信号生成并输出CPU复位信号至CPU,根据第二复位信号将存储阵列中记录的重启原因初始值修改为表示掉电重启的数值。
步骤403,CPU接收CPU复位信号,根据接收的CPU复位信号进行重启后,读取存储阵列中记录的表示掉电重启的数值,根据读取的数值识别设备的重启原因是掉电重启,之后将该数值重设为该初始值。
在每次启动后,CPU读取存储阵列中的重启原因初始值。由于该初始值已经被修改成表示掉电重启的数值,所以从存储阵列中读取到的是表示掉电重启的数值;CPU根据读取到的表示掉电重启的数值将设备重启原因识别为掉电重启。之后,CPU将存储阵列中记录的该表示掉电重启的数值修改成该初始值。
本发明实施例中记录设备重启原因的方法除了能够记录掉电重启事件之外,还可以进一步记录并识别CPU异常重启事件。
图5为本发明实施例中另一种记录设备重启原因的方法的流程图。如图5所示,该方法包括以下步骤:
步骤501,CPU定期输出喂狗信号WDI 1至CPLD。当CPU上运行的软件发生死循环时,CPU停止向CPLD输出的第一喂狗信号。
步骤502,CPLD接收CPU输出的喂狗信号WDI 1,以在CPU的控制下输出喂狗信号至第一看门狗,从而对第一看门狗执行喂狗操作。当CPLD未收到喂狗信号WDI 1的时间到达第一阈值时,CPLD将存储阵列中记录的重启原因的初始值修改为表示CPU异常重启的数值,并且CPLD在未收到喂狗信号WDI 1的时间到达第二阈值时,停止向第一看门狗输出喂狗信号WDI 2。
步骤503,第一看门狗在未收到喂狗信号WDI 2的时间到达第三阈值时,向CPLD输出第一复位信号以触发设备全局复位。
步骤504,CPLD接收该第一复位信号,根据接收的第一复位信号生成并输出CPU复位信号至CPU;CPU根据接收的CPU复位信号进行重启后,读取存储阵列中记录的表示设备重启原因的数值,并以读取的数值识别的设备的重启原因是CPU异常重启,之后CPU再将该数值设置为初始值。
CPU每次完成启动后,读取存储阵列中记录的表示设备重启原因的数值。由于该初始值已经被修改为表示CPU异常重启(CPU处于异常状态)的数值,CPU完成启动之后从存储阵列读取到的将是表示CPU异常重启的数值,CPU根据读取的数值识别设备的重启原因是CPU异常重启。之后,CPU将存储阵列中记录的表示CPU异常重启的数值设置为重启原因初始值。
步骤505,CPU上软件的主动重启导致CPU重启,CPU在重启完成之后从存储阵列中取到用于重启原因初始值时,根据读取的该初始值将设备的重启原因识别为软件重启。
由于CPU上承载的软件能够主动重启,并且这种主动导致了CPU的重启,通过上述步骤505,本发明实施例的方法可以进一步记录并识别设备的软件重启事件。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。
基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种用于记录设备重启原因的装置,其特征在于,所述装置包括CPU,第一看门狗、第二看门狗、逻辑芯片及存储阵列;其中,
所述第一看门狗,用于在设备上电启动之后,输出第一复位信号至所述逻辑芯片以触发设备的全局复位;
所述第二看门狗,用于在设备上电启动之后,输出第二复位信号至所述逻辑芯片以触发记录设备重启原因是掉电重启;
所述逻辑芯片,用于接收所述第一复位信号和所述第二复位信号,根据所述第一复位信号生成CPU复位信号并将所述CPU复位信号输出至所述CPU,根据所述第二复位信号将所述存储阵列中记录的重启原因初始值修改为表示掉电重启的数值。
2.根据权利要求1所述的装置,其特征在于,
所述CPU,用于根据所述CPU复位信号进行重启并在启动完成后从所述存储阵列中读取记录的所述表示掉电重启的数值,根据读取的所述表示掉电重启的数值识别设备的重启原因是掉电重启,将存储阵列中记录的所述表示掉电重启的数值设置为所述重启原因初始值。
3.根据权利要求1所述的装置,其特征在于,所述第一复位信号与所述第二复位信号同步;或者,所述第一复位信号晚于所述第二复位信号。
4.根据权利要求1所述的装置,其特征在于,
所述CPU,进一步用于在启动完成之后输出第一喂狗信号至所述的逻辑芯片;
所述逻辑芯片,进一步用于接收所述CPU输出的第一喂狗信号并且基于接收的所述第一喂狗信号向第一看门狗输出第二喂狗信号以对第一看门狗执行喂狗操作。
5.根据权利要求4所述的装置,其特征在于,
所述CPU,进一步用于在所承载的软件发生死循环时停止向所述逻辑芯片输出的所述第一喂狗信号;
所述逻辑芯片,进一步用于在未收到所述第一喂狗信号的时间到达第一阈值时,将所述存储阵列中记录的所述重启原因初始值修改为表示CPU处于异常状态的数值,并且在未收到所述第一喂狗信号的时间到达第二阈值时,停止向所述第一看门狗输出所述第二喂狗信号;
所述第一看门狗,进一步用于在未收到所述第二喂狗信号的时间到达第三阈值时,输出所述第一复位信号至所述逻辑芯片。
6.根据权利要求5所述的装置,其特征在于,
所述CPU,进一步用于在重启完成后读取所述存储阵列中记录的所述表示CPU处于异常状态的数值,根据读取的该数值识别所述设备的重启原因是CPU异常重启,将存储阵列中记录的所述表示CPU处于异常状态的数值设置为所述重启原因初始值。
7.根据权利要求1所述的装置,其特征在于,
所述CPU,进一步用于在重启完成后读取所述存储阵列中的所述重启原因初始值,并且根据从所述存储阵列中读取到的所述重启原因初始值,将所述设备的重启原因识别为软件重启。
8.一种记录设备重启原因的方法,其特征在于,包括:
接收第一看门狗和第二看门狗在上电启动后分别输出的第一复位信号和第二复位信号;
根据所述第一复位信号生成并输出CPU复位信号至CPU,以供所述CPU根据所述CPU复位信号进行重启;根据所述第二复位信号将存储阵列中记录的重启原因初始值修改为表示掉电重启的数值,以供所述CPU在启动完成后从所述存储阵列中读取记录的所述表示掉电重启的数值,根据读取的所述表示掉电重启的数值识别设备的重启原因是掉电重启,将存储阵列中记录的所述表示掉电重启的数值设置为所述重启原因初始值。
9.根据权利要求8所述的方法,其特征在于,所述第一复位信号与所述第二复位信号同步,或者,所述第一复位信号的产生晚于所述第二复位信号。
10.根据权利要求8所述的方法,其特征在于,进一步包括:
接收所述CPU输出的第一喂狗信号;
基于接收的所述第一喂狗信号生成并输出第二喂狗信号至所述CPU;
当未收到所述第一喂狗信号的时间到达第一阈值时,将所述存储阵列中记录的所述重启原因初始值修改为表示CPU处于异常状态的数值;其中所述CPU在所承载的软件发生死循环时停止输出所述第一喂狗信号;
当未收到所述第一喂狗信号的时间到达第二阈值时,停止向所述第一看门狗输出所述第二喂狗信号,以使所述第一看门狗在未收到所述第二喂狗信号的时间到达第三阈值时,输出所述第一复位信号以触发所述设备的全局复位。
11.根据权利要求10所述的方法,其特征在于,进一步包括:
接收所述第一复位信号;并且
根据接收的所述第一复位信号生成所述CPU复位信号,将所述CPU复位输出至所述CPU,以供所述CPU根据所述CPU重启信号进行重启并在在重启完成后读取所述存储阵列中记录的所述表示CPU处于异常状态的数值,根据读取的该数值识别所述设备的重启原因是CPU异常重启,将存储阵列中记录的所述表示CPU处于异常状态的数值设置为所述重启原因初始值。
12.根据权利要求8所述的方法,其特征在于,该方法进一步包括:在所述存储阵列中记录所述重启原因初始值,以供所述CPU在重启完成后自所述存储阵列读取所述重启原因初始值,并在读取到所述重启原因初始值时将所述设备的重启原因识别为软件重启。
CN201110026569.1A 2010-02-01 2011-01-25 用于记录设备重启原因的装置及方法 Active CN102081573B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110026569.1A CN102081573B (zh) 2010-02-01 2011-01-25 用于记录设备重启原因的装置及方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201010104482.7 2010-02-01
CN201010104482 2010-02-01
CN201110026569.1A CN102081573B (zh) 2010-02-01 2011-01-25 用于记录设备重启原因的装置及方法

Publications (2)

Publication Number Publication Date
CN102081573A CN102081573A (zh) 2011-06-01
CN102081573B true CN102081573B (zh) 2014-04-16

Family

ID=44087546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110026569.1A Active CN102081573B (zh) 2010-02-01 2011-01-25 用于记录设备重启原因的装置及方法

Country Status (5)

Country Link
US (1) US8713367B2 (zh)
EP (1) EP2531920A4 (zh)
KR (1) KR101358776B1 (zh)
CN (1) CN102081573B (zh)
WO (1) WO2011091743A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011088416A1 (de) 2010-12-16 2012-06-21 Canon K. K. Informationsverarbeitungsvorrichtung zur geeigneten ausführung einer herunterfahrverarbeitung, verfahren zur steuerung der informationsverarbeitungsvorrichtung und speichermedium
CN102981918B (zh) * 2012-11-23 2015-07-15 西安坤蓝电子技术有限公司 实现嵌套式的看门狗电路及其喂狗信号的传送方法
TWI493458B (zh) * 2013-04-22 2015-07-21 Acer Inc 電腦裝置及其重開機方法
US9389942B2 (en) 2013-10-18 2016-07-12 Intel Corporation Determine when an error log was created
CN103645962A (zh) * 2013-12-18 2014-03-19 北京华环电子股份有限公司 基于NiosII系统的看门狗实现方法及装置
CN105279037B (zh) * 2014-06-30 2019-01-11 惠州市伟乐科技股份有限公司 看门狗监控方法和系统
CN105242980A (zh) * 2015-10-26 2016-01-13 上海斐讯数据通信技术有限公司 互补式看门狗系统及互补式看门狗的监测方法
JP2018163498A (ja) * 2017-03-24 2018-10-18 エイブリック株式会社 監視回路
CN109062720A (zh) * 2018-07-18 2018-12-21 郑州云海信息技术有限公司 一种服务器、服务器主板及其复位识别方法及系统
KR20200019444A (ko) * 2018-08-14 2020-02-24 에스케이하이닉스 주식회사 데이터 처리 시스템 및 데이터 처리 시스템의 동작 방법
CN109753373A (zh) * 2019-01-11 2019-05-14 东莞固高自动化技术有限公司 基于复杂可编程逻辑器件的智能看门狗系统
CN113535441B (zh) * 2020-04-13 2023-01-31 烽火通信科技股份有限公司 一种嵌入式系统故障诊断装置及方法
CN111813590B (zh) * 2020-06-02 2024-02-27 中车株洲电力机车研究所有限公司 用于诊断主控模块异常复位的方法与装置、及主控模块
CN113296594A (zh) * 2021-04-29 2021-08-24 深圳市风云实业有限公司 一种记录电子设备掉电时间和次数的系统和方法
CN117453495B (zh) * 2023-12-26 2024-03-26 睿思芯科(成都)科技有限公司 支持在线纠错和调试的芯片、设计方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873217A (zh) * 2010-07-08 2010-10-27 杭州华三通信技术有限公司 一种以太网供电设备重启控制方法及其装置
CN102141939A (zh) * 2010-02-01 2011-08-03 杭州华三通信技术有限公司 可记录整机重启原因的装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960195A (en) * 1996-06-03 1999-09-28 Samsung Electronics Co., Ltd. Intelligent volatile memory initialization
US6697973B1 (en) * 1999-12-08 2004-02-24 International Business Machines Corporation High availability processor based systems
US20030065916A1 (en) * 2001-07-30 2003-04-03 Erickson Michael John Method and apparatus for diagnosing the cause of a processor reset
JP3824548B2 (ja) * 2001-12-20 2006-09-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体
US20040003317A1 (en) * 2002-06-27 2004-01-01 Atul Kwatra Method and apparatus for implementing fault detection and correction in a computer system that requires high reliability and system manageability
US7219264B2 (en) * 2003-05-09 2007-05-15 Tekelec Methods and systems for preserving dynamic random access memory contents responsive to hung processor condition
CN100395722C (zh) 2003-12-24 2008-06-18 华为技术有限公司 一种对控制系统异常状态信息进行保存的方法
US7162666B2 (en) * 2004-03-26 2007-01-09 Emc Corporation Multi-processor system having a watchdog for interrupting the multiple processors and deferring preemption until release of spinlocks
CN2824125Y (zh) * 2005-08-11 2006-10-04 中兴通讯股份有限公司 一种看门狗复位电路
CN101286130B (zh) * 2007-04-11 2010-09-29 中兴通讯股份有限公司 一种嵌入式设备的复位故障定位的实现方法
CN101556551B (zh) * 2009-04-15 2011-12-21 杭州华三通信技术有限公司 设备故障日志的硬件获取系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102141939A (zh) * 2010-02-01 2011-08-03 杭州华三通信技术有限公司 可记录整机重启原因的装置
CN101873217A (zh) * 2010-07-08 2010-10-27 杭州华三通信技术有限公司 一种以太网供电设备重启控制方法及其装置

Also Published As

Publication number Publication date
WO2011091743A1 (en) 2011-08-04
EP2531920A4 (en) 2014-09-03
US20120124362A1 (en) 2012-05-17
CN102081573A (zh) 2011-06-01
EP2531920A1 (en) 2012-12-12
KR20120123507A (ko) 2012-11-08
US8713367B2 (en) 2014-04-29
KR101358776B1 (ko) 2014-02-05

Similar Documents

Publication Publication Date Title
CN102081573B (zh) 用于记录设备重启原因的装置及方法
CN103827834B (zh) 一种内存数据的迁移方法、计算机和装置
US20140068350A1 (en) Self-checking system and method using same
CN102141939B (zh) 可记录整机重启原因的装置
CN111324192A (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
CN108549591A (zh) 一种嵌入式系统的黑匣子装置及其实现方法
EP3167371B1 (en) A method for diagnosing power supply failure in a wireless communication device
CN106682162A (zh) 日志管理方法及装置
CN112462920B (zh) 一种电源控制的方法、装置、服务器及存储介质
CN103257922B (zh) 一种快速测试bios与os接口代码可靠性的方法
US11023335B2 (en) Computer and control method thereof for diagnosing abnormality
CN115373997A (zh) 一种多核SoC的板卡固件异常监测及核心数据导出方法
CN113672306B (zh) 服务器组件自检异常恢复方法、装置、系统及介质
CN104331341B (zh) 一种基于fpga的故障恢复方法
CN113157519A (zh) 一种嵌入式计算机系统故障辅助定位架构及方法
CN102736957A (zh) 复位方法及其装置
JP2018180982A (ja) 情報処理装置、およびログ記録方法
CN109102839A (zh) 一种坏块标记方法、装置、设备及可读存储介质
CN110853695A (zh) 一种测试nvram存储性能的方法
CN109634796A (zh) 一种计算机的故障诊断方法、装置及系统
CN112988442B (zh) 一种服务器运行阶段传送故障信息的方法和设备
US10922023B2 (en) Method for accessing code SRAM and electronic device
CN111045891B (zh) 基于java多线程的监控方法、装置、设备以及存储介质
CN111445598A (zh) 光纤航姿系统信息处理方法、装置、设备及存储介质
CN106468911B (zh) 一种用于故障诊断的故障信息备份方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: NEW H3C TECHNOLOGIES Co.,Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: HANGZHOU H3C TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230602

Address after: 310052 11th Floor, 466 Changhe Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: H3C INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 310052 Changhe Road, Binjiang District, Hangzhou, Zhejiang Province, No. 466

Patentee before: NEW H3C TECHNOLOGIES Co.,Ltd.