CN111884830A - 一种基于bmc保留故障现场的方法及装置 - Google Patents
一种基于bmc保留故障现场的方法及装置 Download PDFInfo
- Publication number
- CN111884830A CN111884830A CN202010590059.6A CN202010590059A CN111884830A CN 111884830 A CN111884830 A CN 111884830A CN 202010590059 A CN202010590059 A CN 202010590059A CN 111884830 A CN111884830 A CN 111884830A
- Authority
- CN
- China
- Prior art keywords
- fault
- level sensor
- information
- board level
- bmc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000012544 monitoring process Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 13
- 230000014759 maintenance of location Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 9
- 238000012423 maintenance Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开一种基于BMC保留故障现场的方法及装置,采集各个板级传感器的检测数据信息;根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;将故障信息进行保存和推送。本发明充分利用BMC的平台监控功能,在记录系统故障的详细日志同时,将与该故障相关联的状态信息进行同步保存,提高故障上报的准确性和完整性。
Description
技术领域
本发明涉及BMC所在平台故障保留领域,具体涉及一种基于BMC保留故障现场的方法及装置。
背景技术
BMC(Baseboard Manager Controller)作为基板管理控制器,提供服务器或交换机的平台管理功能。BMC在平台管理的同时,还负责记录各种硬件的信息和日志记录,用于提示用户或者后续问题的定位。该功能对于一些系统故障定位起到非常重要的作用,但目前大多数BMC对故障事件的捕获,仅记录故障出现的事件日志,而不对故障前后的状态信息进行统计。这样对运维人员来说是非常不友好的,仅知道故障发生过,但需要通过复现故障等其他测试方法来重新定位故障,费时费力。更糟糕的情况下,故障的触发条件比较苛刻,很难复现或模拟,这将对故障的定位工作带来很大的阻力。
发明内容
为解决上述问题,本发明提供一种基于BMC保留故障现场的方法及装置,对故障现场进行保留,便于确定故障。
本发明的技术方案是:一种基于BMC保留故障现场的方法,包括以下步骤:
采集各个板级传感器的检测数据信息;
根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
将故障信息进行保存和推送。
进一步地,根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障,具体为:
当某个板级传感器所检测数据信息不在其对应数据阈值范围内时,对该板级传感器进行故障去抖处理;
根据故障去抖处理结果判断该板级传感器是否发生故障;
其中,故障去抖处理为根据预设采集间隔连续采集若干次该板级传感器的检测数据;
若每次检测数据均不在对应数据阈值范围内,则判定该板级传感器故障。
进一步地,板级传感器的现场信息包括:传感器名、传感器ID、故障发生的时间、发生故障时该板级传感器的检测数据、去抖逻辑完成时间、该板级传感器的数据阈值范围。
进一步地,故障信息还包括与发生故障的板级传感器的同一区域的其他同类型板级传感器在故障发生时的检测数据,其中故障发生时是指发生故障的板级传感器故障发生时。
进一步地,该方法包括以下步骤:
实时监测BMC所在平台是否有系统故障发生;
当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
进一步地,当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存,具体为:
实时将CPU串口日志信息缓存进一缓存池中,该缓存池默认能缓存若干条CPU串口日志信息;
当监测到有系统故障发生时,将缓存池中的全部CPU串口日志信息取出并持久化保存。
进一步地,该方法还包括当监测到有系统故障发生时,同时将系统故障发生后的若干CPU串口日志信息进行保存。
进一步地,当监测到有系统故障发生时,同时将系统故障发生后的若干CPU串口日志信息进行保存,具体为:
当检测到有系统故障发生时,将缓存池扩容;
继续将CPU串口日志信息缓存进缓存池;
当缓存池存满日志后,将缓存池中的全部CPU串口日志信息取出并持久化保存。
本发明的技术方案还包括一种基于上述方法的基于BMC保留现场故障的装置,包括,
数据采集模块:采集各个板级传感器的检测数据信息;
故障判断模块:根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
故障信息记录模块:若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
故障信息保存推送模块:将故障信息进行保存和推送。
进一步地,该装置还包括:
系统故障监测模块:实时监测BMC所在平台是否有系统故障发生;
日志信息保存模块:当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
本发明提供一种基于BMC保留故障现场的方法及装置,充分利用BMC的平台监控功能,在记录系统故障的详细日志同时,将与该故障相关联的状态信息进行同步保存,提高故障上报的准确性和完整性;充分利用系统端的状态日志信息,最大程度保存故障或事件发生前后的现场状态,为上下游协作定位提高可靠依据,为运维人员和开发人员定位故障、处理bug提供了便利。
附图说明
图1是本发明的具体实施例一的方法流程示意图。
图2是本发明的具体实施例二结构示意框图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例一
本实施例提供一种基于BMC保留故障现场的方法,基于BMC的板级监控和事件感知能力,根据故障的不同,将BMC所在平台的故障分为两大类:第一类,板级传感器故障,BMC通过I2C接口,定时采集不同传感器的数值信息,并为每个传感器设置警告和严重阈值。在采集传感器信息的同时,判断传感器信息是否不符合阈值范围,一旦发现连续出现超阈或低阈现象,则视为板级传感器故障。第二类,系统故障,BMC依靠CPLD对交换机OS的感知能力,监控CPLD寄存器状态来实时感知系统故障,主要包括一些上下电操作、watchdog超时、内存故障等。
(一)板级传感器故障
BMC将所有板级传感器按照类型分为温度传感器,电压传感器,电流传感器以及风扇转速传感器等等,每类传感器再按照区域进行细化分类,具体分类信息如下表1,以温度传感器CPU区域为例,该区域包含多个温度传感器都是与CPU相关的温度监控点。
表1 板级传感器分类
如图1所示,本实施例提供的一种基于BMC保留故障现场的方法,包括以下步骤实现板级传感器故障的现场保留,需要说明的是,该方法由BMC执行。
S1,采集各个板级传感器的检测数据信息;
需要说明的是,可定时采集各个板级传感器的检测数据,例如BMC定时通过I2C总线读取CPU区域的温度传感器所检测数据。
S2,根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
每个板级传感器都设置一个数据阈值范围,包括一个告警低阈和告警高阈。一旦发现某个板级传感器所检测数据低于告警低阈或高于告警高阈,则认为该板级传感器有发生故障的可能。为保证BMC故障上报的准确性,需进行故障去抖处理。
即当某个板级传感器所检测数据信息不在其对应数据阈值范围内时,对该板级传感器进行故障去抖处理;根据故障去抖处理结果判断该板级传感器是否发生故障。
故障去抖处理为根据预设采集间隔连续采集若干次该板级传感器的检测数据。若每次检测数据均不在对应数据阈值范围内,则判定该板级传感器故障。比如当某个板级传感器所检测数据信息不在其对应数据阈值范围内时,持续对该板级传感器进行10次采集,采集间隔为3秒,若10次采集数据都不在对应数据阈值范围内,则认为该板级传感器故障确实存在。
S3,若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
S4,将故障信息进行保存和推送。
上述步骤S3中,当BMC确认板级传感器发送故障时,记录故障信息进行故障现场详细保留。
故障保留的方式为:(1)记录故障发生的事件日志,循IPMI标准协议,记录SEL日志,主要作用为记录故障发生的事实。SEL日志由于符合标准化IPMI协议,有助于后期开发人员或运维人员进行多节点故障信息统计,对故障信息进行统筹处理。(2)记录故障板级传感器的现场信息,包括传感器名、传感器ID、故障发生的时间、发生故障时该板级传感器的检测数据、去抖逻辑完成时间、该板级传感器的数据阈值范围。该信息的作用是记录发生故障的传感器当时的具体信息,为故障定位提供故障的现场信息。
优选的,只记录发生故障的板级传感器信息是不完整的,本实施例的故障保留的方式还包括:(3)记录与发生故障的板级传感器的同一区域的其他同类型板级传感器在故障发生时的检测数据,其中故障发生时是指发生故障的板级传感器故障发生时。如CPU区域的sensor1温度点确认发生故障,已保留故障发生时sensor1的数据信息,还需同时保留与sensor1同一区域的sensor2/sensor3等数据信息,便于故障定位时整体分析(为何相同区域只有sensor1出现故障,是否是传感器损坏导致的数据信息读取错误等原因)。
本实施例中,步骤S4将故障信息进行保存和推送,是指将步骤S3所记录故障信息通过syslog协议推送至远程日志服务器。通过建立统一的远程故障信息收集服务器,可以实现对多节点场景下的故障统一收集功能,提高故障定位的效率和全面性。
(二)系统故障
BMC除了提供板级传感器的信息监控功能外,还可以对系统故障进行监控,主要包括系统的上下电动作,系统启动过程中watchdog超时,内存错误,系统内核错误等事件或故障。
对系统故障现场的保留需要BMC对系统故障进行持续监控,按照故障的不同,采取不同的监控策略(本实施例是指只保存故障前的日志还是同时保存故障后的日志)。系统故障不需要去抖处理,当监控到事件或故障发生时,立刻进行事件日志的记录(SEL),确保不遗漏或错过系统故障的发生记录。与板级传感器故障不同,仅故障发生当时现场对于故障定位的意义不大,更关键的是需要对故障发生前后的CPU串口信息进行保留,为故障定位提供一个完整的上下文。
具体的,该方法还包括以下步骤:
SS1,实时监测BMC所在平台是否有系统故障发生;
SS2,当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
该步骤SS2具体为:实时将CPU串口日志信息缓存进一缓存池中,该缓存池默认能缓存若干条CPU串口日志信息;当监测到有系统故障发生时,将缓存池中的全部CPU串口日志信息取出并持久化保存。
比如,缓存池大小为300条可以理解为缓存池中始终存储最近的300条串口日志信息。当BMC检测到系统故障时,利用缓冲池提供的日志全部持久化到本地或远程的接口,将串口日志进行保存。以BMC监控系统端watchdog超时事件为例,当系统端长时间未更新watchdog时,BMC将认为系统出现故障导致喂狗动作终止,则立刻记录系统watchdog超时事件,并将缓存池中的日志全部取出,串口日志中会保存watchdog超时前系统日志,包括bios报错日志、内核日志等等。
需要说明的是,统端通过南桥接口以LPC Bus的方式与BMC进行通信,将系统端的CPU串口日志信息(包括内核以及驱动日志信息)传输给BMC,BMC通过BMC芯片中集成的UART模块传输到串口监听服务功能模块,串口缓存服务功能模块对CPU串口日志信息实时缓存进缓存池。
优选的,本实施例还包括当监测到有系统故障发生时,同时将系统故障发生后的若干CPU串口日志信息进行保存。具体为:当检测到有系统故障发生时,将缓存池扩容;继续将CPU串口日志信息缓存进缓存池;当缓存池存满日志后,将缓存池中的全部CPU串口日志信息取出并持久化保存。
例如系统冷重启动作,维护人员关心的不仅仅是执行系统冷重启之前的系统日志,还关心重启过程中bios运行日志及初始化日志。为了保证事件发生前后日志的完整性,日志接收模块提供事件发生后继续缓存新的N条系统日志功能。即当系统执行冷重启功能时,将日志缓存池扩容100条,且扩容区域存满日志后,将缓存池一并取出。这样就保存了事件发生之前的300条日志和事件发生之后的100条日志,保存了事件发生的前后环境,便于故障或事件的分析定位。
实施例二
如图2所示,在实施例一基础上,本实施例提供一种基于BMC保留现场故障的装置,包括以下功能模块,实现故障现场的保留,便于分析故障。
数据采集模块101:采集各个板级传感器的检测数据信息;
故障判断模块102:根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
故障信息记录模块103:若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
故障信息保存推送模块104:将故障信息进行保存和推送。
以上功能模块是对板级传感器故障的故障现场处理,其中故障判断模块102通过故障去抖处理确认是否发生故障。
故障信息记录模块103所记录故障信息包括故障发生的事件日志和该板级传感器的现场信息。故障发生的事件日志用于记录故障发生的事实,有助于后期开发人员或运维人员进行多节点故障信息统计,对故障信息进行统筹处理。板级传感器的现场信息包括传感器名、传感器ID、故障发生的时间、发生故障时该板级传感器的检测数据、去抖逻辑完成时间、该板级传感器的数据阈值范围。该信息的作用是记录发生故障的传感器当时的具体信息,为故障定位提供故障的现场信息。
另外,故障信息记录模块103所记录故障信息还包括与发生故障的板级传感器的同一区域的其他同类型板级传感器在故障发生时的检测数据,其中故障发生时是指发生故障的板级传感器故障发生时。可分析相同区域为何只有一个传感器出现故障,是否是传感器损坏导致的数据信息读取错误等原因。
BMC还可对系统事件感知,保留系统故障现场信息。具体的,本系统还包括以下功能模块,实现系统故障现场的处理。
系统故障监测模块105:实时监测BMC所在平台是否有系统故障发生;
日志信息保存模块106:当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
需要说明的是,BMC实时将CPU串口日志信息缓存进一缓存池中,该缓存池默认能缓存若干条CPU串口日志信息,比如300条,可以理解为缓存池中始终存储最近的300条串口日志信息。日志信息保存模块106当监测到有系统故障发生时,将缓存池中的全部CPU串口日志信息取出并持久化保存。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
Claims (10)
1.一种基于BMC保留故障现场的方法,其特征在于,包括以下步骤:
采集各个板级传感器的检测数据信息;
根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
将故障信息进行保存和推送。
2.根据权利要求1所述的基于BMC保留故障现场的方法,其特征在于,根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障,具体为:
当某个板级传感器所检测数据信息不在其对应数据阈值范围内时,对该板级传感器进行故障去抖处理;
根据故障去抖处理结果判断该板级传感器是否发生故障;
其中,故障去抖处理为根据预设采集间隔连续采集若干次该板级传感器的检测数据;
若每次检测数据均不在对应数据阈值范围内,则判定该板级传感器故障。
3.根据权利要求2所述的基于BMC保留故障现场的方法,其特征在于,板级传感器的现场信息包括:传感器名、传感器ID、故障发生的时间、发生故障时该板级传感器的检测数据、去抖逻辑完成时间、该板级传感器的数据阈值范围。
4.根据权利要求3所述的基于BMC保留故障现场的方法,其特征在于,故障信息还包括与发生故障的板级传感器的同一区域的其他同类型板级传感器在故障发生时的检测数据,其中故障发生时是指发生故障的板级传感器故障发生时。
5.根据权利要求1-4任一项所述的基于BMC保留故障现场的方法,其特征在于,该方法包括以下步骤:
实时监测BMC所在平台是否有系统故障发生;
当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
6.根据权利要求5所述的基于BMC保留故障现场的方法,其特征在于,当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存,具体为:
实时将CPU串口日志信息缓存进一缓存池中,该缓存池默认能缓存若干条CPU串口日志信息;
当监测到有系统故障发生时,将缓存池中的全部CPU串口日志信息取出并持久化保存。
7.根据权利要求6所述的基于BMC保留故障现场的方法,其特征在于,该方法还包括当监测到有系统故障发生时,同时将系统故障发生后的若干CPU串口日志信息进行保存。
8.根据权利要求7所述的基于BMC保留故障现场的方法,其特征在于,当监测到有系统故障发生时,同时将系统故障发生后的若干CPU串口日志信息进行保存,具体为:
当检测到有系统故障发生时,将缓存池扩容;
继续将CPU串口日志信息缓存进缓存池;
当缓存池存满日志后,将缓存池中的全部CPU串口日志信息取出并持久化保存。
9.一种基于权利要求1-8任一项所述方法的基于BMC保留故障现场的装置,其特征在于,包括,
数据采集模块:采集各个板级传感器的检测数据信息;
故障判断模块:根据各个板级传感器各自对应的数据阈值范围判断是否有板级传感器发生故障;
故障信息记录模块:若某个板级传感器发生故障,则记录故障信息,故障信息包括故障发生的事件日志和该板级传感器的现场信息;
故障信息保存推送模块:将故障信息进行保存和推送。
10.根据权利要求9所述的基于BMC保留故障现场的装置,其特征在于,该装置还包括:
系统故障监测模块:实时监测BMC所在平台是否有系统故障发生;
日志信息保存模块:当监测到有系统故障发生时,将系统故障发生前的若干CPU串口日志信息进行保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010590059.6A CN111884830B (zh) | 2020-06-24 | 2020-06-24 | 一种基于bmc保留故障现场的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010590059.6A CN111884830B (zh) | 2020-06-24 | 2020-06-24 | 一种基于bmc保留故障现场的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111884830A true CN111884830A (zh) | 2020-11-03 |
CN111884830B CN111884830B (zh) | 2023-01-10 |
Family
ID=73158327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010590059.6A Active CN111884830B (zh) | 2020-06-24 | 2020-06-24 | 一种基于bmc保留故障现场的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111884830B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010341A (zh) * | 2021-03-12 | 2021-06-22 | 山东英信计算机技术有限公司 | 一种故障内存定位的方法和设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109631994A (zh) * | 2018-12-14 | 2019-04-16 | 北京计算机技术及应用研究所 | 操作显控台的自动化检测以及故障定位方法 |
CN110187996A (zh) * | 2019-05-30 | 2019-08-30 | 苏州浪潮智能科技有限公司 | Bmc主进程故障诊断方法、装置、设备及可读存储介质 |
CN111314115A (zh) * | 2020-01-19 | 2020-06-19 | 苏州浪潮智能科技有限公司 | 一种基于idl日志的告警方法、装置、设备及可读介质 |
-
2020
- 2020-06-24 CN CN202010590059.6A patent/CN111884830B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109631994A (zh) * | 2018-12-14 | 2019-04-16 | 北京计算机技术及应用研究所 | 操作显控台的自动化检测以及故障定位方法 |
CN110187996A (zh) * | 2019-05-30 | 2019-08-30 | 苏州浪潮智能科技有限公司 | Bmc主进程故障诊断方法、装置、设备及可读存储介质 |
CN111314115A (zh) * | 2020-01-19 | 2020-06-19 | 苏州浪潮智能科技有限公司 | 一种基于idl日志的告警方法、装置、设备及可读介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010341A (zh) * | 2021-03-12 | 2021-06-22 | 山东英信计算机技术有限公司 | 一种故障内存定位的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111884830B (zh) | 2023-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106789306B (zh) | 通信设备软件故障检测收集恢复方法和系统 | |
US20040003327A1 (en) | Method and system to implement a system event log for system manageability | |
WO2017063505A1 (zh) | 一种服务器硬件故障检测方法及其装置和服务器 | |
US20060212754A1 (en) | Multiprocessor system | |
CN111414268B (zh) | 故障处理方法、装置及服务器 | |
US20080270827A1 (en) | Recovering diagnostic data after out-of-band data capture failure | |
CN105607973B (zh) | 一种虚拟机系统中设备故障处理的方法、装置及系统 | |
CN113708986B (zh) | 服务器监控装置、方法及计算机可读存储介质 | |
CN110609778A (zh) | 一种保存服务器宕机日志的方法及系统 | |
CN111884830B (zh) | 一种基于bmc保留故障现场的方法及装置 | |
CN114003417B (zh) | 实现raid卡故障自动转存的方法、装置及存储介质 | |
CN113010341A (zh) | 一种故障内存定位的方法和设备 | |
JP6880961B2 (ja) | 情報処理装置、およびログ記録方法 | |
CN105786679A (zh) | 一种自动化测试监控系统及方法以及移动终端 | |
CN112506693A (zh) | 一种记录异常信息的方法、装置、存储介质和电子设备 | |
CN112445749A (zh) | 一种信号检测记录方法、系统、设备以及介质 | |
CN116501705A (zh) | 基于ras的内存信息收集解析方法、系统、设备及介质 | |
CN112988442B (zh) | 一种服务器运行阶段传送故障信息的方法和设备 | |
CN112213980A (zh) | 一种单片机故障诊断板卡及方法 | |
CN114138524A (zh) | 一种服务器中bmc的故障处理方法、系统及相关装置 | |
CN113064776A (zh) | 一种bmc故障的诊断方法及装置 | |
CN114003477A (zh) | 慢盘诊断信息收集方法、系统、终端及存储介质 | |
CN109491846B (zh) | 一种用于服务器抓取SATA硬盘trace的方法和系统 | |
CN113742166A (zh) | 一种服务器系统器件日志记录方法、装置及系统 | |
JP7367495B2 (ja) | 情報処理装置および通信ケーブルログ情報採取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |