CN1996882A - 一种检测方法和设备 - Google Patents

一种检测方法和设备 Download PDF

Info

Publication number
CN1996882A
CN1996882A CN 200610157741 CN200610157741A CN1996882A CN 1996882 A CN1996882 A CN 1996882A CN 200610157741 CN200610157741 CN 200610157741 CN 200610157741 A CN200610157741 A CN 200610157741A CN 1996882 A CN1996882 A CN 1996882A
Authority
CN
China
Prior art keywords
state
recording device
equipment
state recording
unusual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610157741
Other languages
English (en)
Inventor
张锋钢
郭志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200610157741 priority Critical patent/CN1996882A/zh
Publication of CN1996882A publication Critical patent/CN1996882A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提出了一种检测方法,用于检测设备故障信息,该方法包括,设置状态记录装置,所述状态记录装置用于记录被检测装置的状态,通过查询状态记录装置的状态来检测故障信息;通过设置状态记录装置,能够在单板发生复位故障时,对各种复位原因进行记录,从而能够快速定位故障原因,增强系统的可维护性。

Description

一种检测方法和设备
技术领域
本发明涉及通信技术领域,尤其涉及一种检测方法和设备。
背景技术
现在网络设备制造企业的竞争日趋激烈,运营商对网络设备的质量越来越高,故障发生后对故障定位速度和解决措施非常重视。在产品维护过程中,经常会碰到网上单板重启的情况,这时没有任何记录信息告诉我们是什么原因导致的复位。
现有技术中,解决该问题的方案为,单板重启前打印遗言和过一段时间将单板信息记录到日志中是最常用的技术方案。单板重启前打印遗言的基本思路是在单板运行中发生故障,如果CPU部分正常,可以将单板故障断言写到Flash里面或发送到控制单元,然后重启单板;过一段时间将单板信息记录到日志中的基本思路是在单板运行中不断的将单板信息写到日志中,如果发生单板复位,则分析前面的日志信息来查找原因。这种方案只能对一些较长时间存在的故障能够收集信息,对于突然单板复位等故障,利用该方案则不能够收集故障信息。
发明内容
本发明实施例提出了一种检测方法,用于检测设备故障信息。
一种检测方法,包括,设置状态记录装置,所述状态记录装置用于记录被检测装置的状态;通过查询状态记录装置的状态来检测故障信息。
通过设置状态记录装置,能够在单板发生复位故障时,对各种复位原因进行记录,从而能够快速定位故障原因,增强系统的可维护性。
附图说明
图1为本发明实施例的看门狗复位监控的流程图;
图2为本发明实施例的电源掉电监控的流程图。
具体实施方式
为使本发明的目的、技术方案、及优点更加清楚明白,以下参照附图并举实施例作进一步详细说明。
本实施例的方案解决了设备在运行过程中,单板突然复位而没有留下任何日志记录的问题,通过对单板复位进行监控并记录产生复位原因,从而检测出故障的原因,本方案可以监控单板上面的所有复位信号,当该信号产生复位时,记录复位动作。
实施例基本方案如下,
提供了一种检测方法,包括,设置状态记录装置,所述状态记录装置用于记录被检测装置的状态;通过查询状态记录装置的状态来检测故障信息。
优选的,所述状态记录装置的状态包括正常运行状态和异常状态。
优选的,该方法还包括,设备出现异常时或异常后重启时,把设备内出现的异常所对应的状态记录装置设置为异常状态。
优选的,该方法还包括,设备重启后,把为异常状态的状态记录装置设置为正常运行状态。
优选的,所述状态记录装置为寄存器。
还提供了一种检测设备,包括,
状态记录装置,与被检测设备相连接,用于记录被检测设备的状态;
查询模块,与状态记录装置相连接,用于查询状态记录装置的状态;
状态设置模块,与状态记录装置相连接,用于设置状态记录装置的状态。
优选的,所述状态设置模块在设备出现异常时或异常后重启时,把设备内出现的异常所对应的状态记录装置设置为异常状态。
优选的,所述状态设置模块在设备重启后,把为异常状态的状态记录装置设置为正常运行状态。
下面以看门狗复位为例具体进行说明,其它复位信号也都可以采用本方法进行检测。
在单板或设备内部设置看门狗复位监控寄存器,该寄存器用于记录看门狗复位信息。该寄存器的内容与看门狗的运行状态相关,即当看门狗溢出产生复位时,该寄存器设置为某一值(溢出标志,比如为1),当单板正常启动时,可以将该寄存器设置为另一值(比如为0)。在单板启动过程中,通过读取该寄存器,就可以判断故障信息:如果寄存器的值为复位时设置的值,则说明上次复位的原因是看门狗溢出导致,然后将该寄存器设置为正常启动值,进入监控状态;如果是单板正常启动设置的值,则说明复位原因非看门狗溢出导致。
如图1看门狗复位监控的流程图所示,
101、单板复位启动;
102、检测看门狗检控寄存器是否为溢出标志,是则执行103,否则执行105;
103、将复位原因上报给系统软件;
104、把看门狗监控寄存器的值为正常启动值;
105、单板启动成功,正常运行;
106、单板异常需要重新启动时,如果是看门狗益处导致的重启,则把看门狗监控寄存器的值设置为溢出标志。
下面的一个实施例为单板电源的掉电监控实施例,其方案如下:
设置掉电监控寄存器,该寄存器不受复位信号控制。这个寄存器可以设置在CPLD或FPGA中,利用其刚上电时,其寄存器初始化为固定值;当然也可以定义在其它存在上电初始值的存储器中。单板正常启动后,将该寄存器设置为正常启动值,只要单板不掉电,该寄存器的值保持不变;在单板启动过程中,软件读取该寄存器,如果其值为上电初始值,则说明上次复位的原因是掉电导致,将此信息上报给系统软件,然后将该寄存器设置为正常启动值,进入监控状态。如果是单板正常启动设置的值,则说明复位原因非电源掉电导致。
如图2电源掉电监控的流程图所示,
201、单板复位启动;
202、判断掉电监控寄存器是否为上电初始值,如是则执行203,如否则是205;
203、将复位原因上报给系统软件;
204、把掉电监控寄存器的值设置为正常启动值;
205、单板启动成功,正常运行;
206、单板出现异常重新启动,如果是电源掉电导致,掉电监控寄存器的值自动设为上电初始值。
本发明中的寄存器既可以被本单板上的CPU访问,也可以被其它的单板或设备访问,以防止本单板CPU一直处于挂死状态,无法上报复位监控结果,具体实现方式可以采用I2C总线或其它总线的访问方式。此外,保存复位原因既可以使用寄存器,也可用其它存储器,例如Flash,NVRAM等,在本申请文件中,使用状态记录装置来代替寄存器或存储器;在前面描述的实现方案中,表示复位原因的值可使用任何数字;本发明的103、203步骤中也可以把状态记录装置中的值(也可以成为状态,只要保证一个状态即复位原因对应一个值就可以了)存储到存储装置中,便于后续软件通过直接访问存储装置来获得故障信息。
相应的,本发明提出一种检测设备,包括状态记录装置,与状态记录装置相连接,其最少包括正常运行状态和异常状态两个状态,用于记录被检测设备中的某个装置的状态,比如电源,看门狗等等;查询模块,与状态记录装置相连接,用于查询状态记录装置的状态;状态设置模块,与状态记录装置相连接,用于设置状态记录装置的状态。
通过设置状态记录装置,能够在单板发生复位故障时,对各种复位原因进行记录,从而能够快速定位故障原因,增强系统的可维护性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1、一种检测方法,其特征在于,该方法包括,
设置状态记录装置,所述状态记录装置用于记录被检测装置的状态;
通过查询状态记录装置的状态来检测故障信息。
2、如权利要求1所述的方法,其特征在于,所述状态记录装置的状态包括正常运行状态和异常状态。
3、如权利要求2所述的方法,其特征在于,该方法还包括,
设备出现异常时或异常后重启时,把设备内出现的异常所对应的状态记录装置设置为异常状态。
4、如权利要求3所述的方法,其特征在于,该方法还包括,
设备重启后,把为异常状态的状态记录装置设置为正常运行状态。
5、如权利要求4所述的方法,其特征在于,所述状态记录装置为寄存器。
6、一种检测设备,其特征在于,包括,
状态记录装置,与被检测设备相连接,用于记录被检测设备的状态;
查询模块,与状态记录装置相连接,用于查询状态记录装置的状态;
状态设置模块,与状态记录装置相连接,用于设置状态记录装置的状态。
7、如权利要求6所述的设备,其特征在于,所述状态设置模块在设备出现异常时或异常后重启时,把设备内出现的异常所对应的状态记录装置设置为异常状态。
8、如权利要求7所述的设备,其特征在于,所述状态设置模块在设备重启后,把为异常状态的状态记录装置设置为正常运行状态。
CN 200610157741 2006-12-27 2006-12-27 一种检测方法和设备 Pending CN1996882A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610157741 CN1996882A (zh) 2006-12-27 2006-12-27 一种检测方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610157741 CN1996882A (zh) 2006-12-27 2006-12-27 一种检测方法和设备

Publications (1)

Publication Number Publication Date
CN1996882A true CN1996882A (zh) 2007-07-11

Family

ID=38251830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610157741 Pending CN1996882A (zh) 2006-12-27 2006-12-27 一种检测方法和设备

Country Status (1)

Country Link
CN (1) CN1996882A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159685B (zh) * 2007-11-01 2011-03-02 中兴通讯股份有限公司 一种启动可插拔件的方法
CN101316139B (zh) * 2008-07-14 2011-08-10 中兴通讯股份有限公司 一种光传输设备的状态检测方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159685B (zh) * 2007-11-01 2011-03-02 中兴通讯股份有限公司 一种启动可插拔件的方法
CN101316139B (zh) * 2008-07-14 2011-08-10 中兴通讯股份有限公司 一种光传输设备的状态检测方法和装置

Similar Documents

Publication Publication Date Title
CN102761439B (zh) Pon接入系统中基于看门狗的异常检测记录装置及方法
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
US20150058538A1 (en) Techniques for updating memory of a chassis management module
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
CN110445638B (zh) 一种交换机系统故障保护方法及装置
TW201635142A (zh) 多台伺服器之容錯之方法及系統
CN1996882A (zh) 一种检测方法和设备
CN114816022A (zh) 一种服务器电源异常监控方法、系统及存储介质
CN117573455A (zh) 一种pcie设备检测系统、方法、装置及产品
CN111488050B (zh) 一种电源监控方法、系统及服务器
JP2006268742A (ja) コンピュータシステム及びその制御方法
CN111726563A (zh) 一种用于列车视频监控系统的视频存储装置
US8533528B2 (en) Fault tolerant power sequencer
JPH07248858A (ja) 停電処理機能を有する電子機器
CN112019455A (zh) 一种基于可编程逻辑器件的交换机监控装置及方法
CN115728665A (zh) 一种电源故障检测电路、方法及系统
CN101140540B (zh) 一种自动监控磁阵故障的方法和系统
CN113419977B (zh) 一种服务器中pcie设备管理系统和服务器
CN111884830B (zh) 一种基于bmc保留故障现场的方法及装置
CN108845903A (zh) 一种测试nvdimm断电保护功能的方法及装置
US20240219986A1 (en) Multi-node system and power supply control method
CN104346252A (zh) 监控芯片对于异常的感测数据的过滤方法
CN211603369U (zh) 一种服务器dc掉电故障定位系统
CN113064095A (zh) 一种电子设备故障检测方法、装置和电子设备
CN111865411A (zh) 一种交换机光模块监控方法、装置及相关组件

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070711