CN108958965B - 一种bmc监控可恢复ecc错误的方法、装置及设备 - Google Patents

一种bmc监控可恢复ecc错误的方法、装置及设备 Download PDF

Info

Publication number
CN108958965B
CN108958965B CN201810687980.5A CN201810687980A CN108958965B CN 108958965 B CN108958965 B CN 108958965B CN 201810687980 A CN201810687980 A CN 201810687980A CN 108958965 B CN108958965 B CN 108958965B
Authority
CN
China
Prior art keywords
ecc error
recoverable ecc
recoverable
bmc
error information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810687980.5A
Other languages
English (en)
Other versions
CN108958965A (zh
Inventor
范雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201810687980.5A priority Critical patent/CN108958965B/zh
Publication of CN108958965A publication Critical patent/CN108958965A/zh
Priority to PCT/CN2018/123678 priority patent/WO2020000956A1/zh
Application granted granted Critical
Publication of CN108958965B publication Critical patent/CN108958965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • G06F11/1044Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping

Abstract

本发明公开了一种BMC监控可恢复ECC错误的方法、装置、设备以及计算机可读存储介质,包括:在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。本发明所提供的方法、装置、设备以及计算机可读存储介质,减少了大量可恢复ECC错误的触发日志产生,减小了对BMC监控系统的SEL日志文件空间的占用。

Description

一种BMC监控可恢复ECC错误的方法、装置及设备
技术领域
本发明涉及服务器安全技术领域,特别是涉及一种BMC监控可恢复ECC错误的方法、装置、设备以及计算机可读存储介质。
背景技术
随着大数据和云计算的发展,高性能的服务器就越来越重要,内存方面,用ECC内存取代普通内存,可以使整个服务器系统在工作时更趋于安全稳定。ECC内存主要会发生两种错误:可恢复ECC(Correctable ECC)错误和不可恢复ECC(Uncorrectable ECC)错误,发生这两种错误时,BIOS(基本输入输出系统)会向BMC监控系统发送该错误消息,BMC以此记录该错误。
现有技术中,BMC监控内存的Correctable ECC报警的方法为:CPU获取ECC内存的数据,比较前后的ECC校验码,若发生错误则会定为错误位置并进行纠正;纠正完成后,会向操作系统发送该日志消息;BIOS从操作系统中获取到该消息后,会组织IPMI命令,将此错误告知BMC,BMC收到BIOS的命令后,解析命令,并记录SEL日志。
当内存发生大量Correctable ECC时,BIOS就会发送给BMC大量IPMI命令,告知BMC内存发生了Correctable ECC错误,这样BMC就记录了大量的SEL日志,但是SEL日志的大小是有限的,这样如果超出SEL日志文件的大小,就会将之前的日志覆盖掉,这样可能会导致很多有用的日志被重复的Correctable ECC日志覆盖掉,当服务器发生故障时,不利于维护人员分析问题。
综上所述可以看出,如何优化BMC监控可恢复ECC错误的报警机制是目前有待解决的问题。
发明内容
本发明的目的是提供一种BMC监控可恢复ECC错误的方法、装置、设备以及计算机可读存储介质,已解决现有技术中BMC监控可恢复ECC错误报警机制会产生大量SEL日志的问题。
为解决上述技术问题,本发明提供一种BMC监控可恢复ECC错误的方法,包括:在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
优选地,所述判断在第二预设时长内是否再次收到所述可恢复ECC错误信息后还包括:若在所述第二预设时长内再次收到所述可恢复ECC错误信息,则循环重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息的操作,直至所述BMC监控系统不再收到所述可恢复ECC错误信息。
优选地,所述在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时包括:在BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器开始计时。
优选地,所述在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时后还包括:若在所述预设时长内,所述BMC监控系统未收到同一可恢复ECC错误信息,则判定首次接收到的所述可恢复ECC错误为误报,并关闭所述定时器,停止计时。
优选地,所述若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志包括:若在预设计时时长内,所述BMC监控系统再次接收到同一可恢复ECC错误信息,则记录一条触发可恢复ECC错误的SEL日志。
本发明还提供了一种BMC监控可恢复ECC错误的装置,包括:
计时模块,用于在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;
记录模块,用于若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
判断模块,用于完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;
恢复模块,用于若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
优选地,还包括循环模块,用于若在所述第二预设时长内再次收到所述可恢复ECC错误信息,则循环重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息的操作,直至所述BMC监控系统不再收到所述可恢复ECC错误信息。
优选地,所述第一计时模块具体用于:在BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器开始计时。
本发明还提供了一种BMC监控可恢复ECC错误的设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种BMC监控可恢复ECC错误的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种BMC监控可恢复ECC错误的方法的步骤。
本发明所提供的BMC监控可恢复ECC错误的方法,在BMC监控系统首次收到可恢复ECC错误信息时,开始计时;判断在第一预设时长内,所述BMC监控系统是否再次收到相同的可恢复ECC错误信息,所述BMC监控系统则记录一条可恢复ECC错误的触发日志;完成所述触发日志的记录后,重新开始计时,判断在第二预设时长内所述BMC监控系统是否再次接收到相同可恢复ECC错误信息;若未收到,则判断所述可恢复ECC错误已恢复,从而记录一条可恢复ECC错误的解除日志,并停止计时。本发明所提供的BMC监控可恢复ECC错误的方法,在首次收到可恢复ECC错误信息时,不记录触发日志,再第二次收到相同可恢复ECC错误信息时,记录一条可恢复ECC错误的触发日志,防止了服务器对可恢复ECC错误信息的误报。在完成所述触发日志的记录后,判断在第二预设时长内是否再次收到相同的可恢复ECC错误信息,即判断所述可恢复ECC错误信息是否已经解决;在所述第二预设时长内所述BMC监控系统未收到相同的可恢复ECC错误信息时,判定所述可恢复ECC错误已经恢复,则所述BMC监控系统记录一条可恢复ECC错误的解除日志。本发明所提供的方法,优化了BMC监控系统处理内存可恢复ECC错误报警的机制,由现有技术中每次可恢复ECC错误均记录一条触发日志变为某一时间段只记录一条触发日志,且当超出上次发生可恢复ECC错误一定时间后,产生一条解除可恢复ECC错误的日志,从而减少了大量可恢复ECC错误的触发日志产生,减小了对BMC监控系统的SEL日志文件空间的占用,有效减少了有用日志被占用的风险,在服务器发生故障时,可以使运维人员更加准确的分析问题,提高了工作效率。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的BMC监控可恢复ECC错误的方法的第一种具体实施例的流程图;
图2为本发明所提供的BMC监控可恢复ECC错误的方法的第二种具体实施例的流程图;
图3为本发明实施例提供的一种BMC监控可恢复ECC错误的装置的结构框图。
具体实施方式
本发明的核心是提供一种BMC监控可恢复ECC错误的方法、装置、设备以及计算机可读存储介质,减少了大量可恢复ECC错误的触发日志产生,减小了对BMC监控系统的SEL日志文件空间的占用。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的BMC监控可恢复ECC错误的方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤S101:在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;
步骤S102:若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
若在预设计时时长内,所述BMC监控系统再次接收到同一可恢复ECC错误信息,则记录一条触发可恢复ECC错误的SEL日志。
在本实施例中,所述第一预设时长可以为10分钟、15分钟等,可以根据实际应用设置。
步骤S103:完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;
在本实施例中,所述第二预设时长可以与第一预设时长相同,也可以与第一预设时长不同。
步骤S104:若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
由于可恢复ECC错误并不是不可恢复性的严重性错误,且可以被CPU自动纠正;因此本实施例所提供的BMC监控可恢复ECC错误的方法,优化了BMC监控系统处理内存可恢复ECC错误报警的机制,由现有技术中每次可恢复ECC错误均记录一条触发日志变为某一时间段只记录一条触发日志,且当超出上次发生可恢复ECC错误一定时间后,产生一条解除可恢复ECC错误的日志,从而减少了大量可恢复ECC错误的触发日志产生,减小了对BMC监控系统的SEL日志文件空间的占用,有效减少了有用日志被占用的风险。
基于上述实施例,在本实施例中,在所述BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器,开始定时,在第一预设时长内,判断所述BMC监控系统是否再次接收到可恢复ECC错误,若未收到,则判断所述BMC监控系统首次接收到的可恢复ECC错误信息为误报。在本实施例中,以所述第一预设时长和所述第二预设时长相同,均为十分钟为例解释说明。请参考图2,图2为本发明所提供的BMC监控可恢复ECC错误的方法的第二种具体实施例的流程图;具体操作步骤如下:
步骤S201:在BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器定时10分钟,开始计时;
步骤S202:若在10分钟内,所述BMC监控系统未收到同一可恢复ECC错误信息,则判定首次接收到的所述可恢复ECC错误为误报,并关闭所述定时器,停止计时;
步骤S203:若在10分钟内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
步骤S204:完成所述可恢复ECC错误的触发日志的记录后,清零所述定时器重新开始计时,判断在10分钟内是否再次收到所述可恢复ECC错误信息;
步骤S205:若在10分钟内再次收到所述可恢复ECC错误信息,则循环清零所述定时器重新开始计时,判断在10分钟内是否再次收到所述可恢复ECC错误信息的操作,直至所述BMC监控系统不再收到所述可恢复ECC错误信息;
步骤S206:若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,关闭所述定时器停止计时。
在本实施例中,将现有技术中每次接收到一条可恢复ECC错误信息均记录一条触发日志,变为某一时间段只记录一条,且当距离上次发生Correctable ECC错误一定时间后,产生一条解除CorrectableECC错误的日,从而节约了BMC的SEL日志的空间,便于运维人员更好的进行维护工作,提高效率。
请参考图3,图3为本发明实施例提供的一种BMC监控可恢复ECC错误的装置的结构框图;具体装置可以包括:
计时模块100,用于在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;
记录模块200,用于若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
判断模块300,用于完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;
恢复模块400,用于若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
本实施例的BMC监控可恢复ECC错误的装置用于实现前述的BMC监控可恢复ECC错误的方法,因此BMC监控可恢复ECC错误的装置中的具体实施方式可见前文中的BMC监控可恢复ECC错误的方法的实施例部分,例如,计时模块100,记录模块200,判断模块300,恢复模块400,分别用于实现上述BMC监控可恢复ECC错误的方法中步骤S101,S102,S103和S104,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种BMC监控可恢复ECC错误的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种BMC监控可恢复ECC错误的方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种BMC监控可恢复ECC错误的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的BMC监控可恢复ECC错误的方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种BMC监控可恢复ECC错误的方法,其特征在于,包括:
在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;
若在第一预设时长内,所述BMC监控系统再次接收到同一可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;
若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
2.如权利要求1所述的方法,其特征在于,所述判断在第二预设时长内是否再次收到所述可恢复ECC错误信息后还包括:
若在所述第二预设时长内再次收到所述可恢复ECC错误信息,则循环重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息的操作,直至所述BMC监控系统不再收到所述可恢复ECC错误信息。
3.如权利要求1所述的方法,其特征在于,所述在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时包括:
在BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器开始计时。
4.如权利要求3所述的方法,其特征在于,所述在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时后还包括:
若在所述预设时长内,所述BMC监控系统未收到同一可恢复ECC错误信息,则判定首次接收到的所述可恢复ECC错误为误报,并关闭所述定时器,停止计时。
5.如权利要求1所述的方法,其特征在于,所述若在第一预设时长内,所述BMC监控系统再次接收到所述可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志包括:
若在预设计时时长内,所述BMC监控系统再次接收到同一可恢复ECC错误信息,则记录一条触发可恢复ECC错误的SEL日志。
6.一种BMC监控可恢复ECC错误的装置,其特征在于,包括:
计时模块,用于在BMC监控系统首次接收到可恢复ECC错误信息时,开始计时;
记录模块,用于若在第一预设时长内,所述BMC监控系统再次接收到同一可恢复ECC错误信息,则记录一条可恢复ECC错误的触发日志;
判断模块,用于完成所述可恢复ECC错误的触发日志的记录后,重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息;
恢复模块,用于若未收到,则判定所述可恢复ECC错误已恢复,从而发送一条可恢复ECC错误的解除日志,并停止计时。
7.如权利要求6所述的装置,其特征在于,还包括循环模块,用于若在所述第二预设时长内再次收到所述可恢复ECC错误信息,则循环重新开始计时,判断在第二预设时长内是否再次收到所述可恢复ECC错误信息的操作,直至所述BMC监控系统不再收到所述可恢复ECC错误信息。
8.如权利要求6所述的装置,其特征在于,第一计时模块具体用于:
在BMC监控系统首次接收到可恢复ECC错误信息时,开启定时器开始计时。
9.一种BMC监控可恢复ECC错误的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述一种BMC监控可恢复ECC错误的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述一种BMC监控可恢复ECC错误的方法的步骤。
CN201810687980.5A 2018-06-28 2018-06-28 一种bmc监控可恢复ecc错误的方法、装置及设备 Active CN108958965B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810687980.5A CN108958965B (zh) 2018-06-28 2018-06-28 一种bmc监控可恢复ecc错误的方法、装置及设备
PCT/CN2018/123678 WO2020000956A1 (zh) 2018-06-28 2018-12-26 一种bmc监控可恢复ecc错误的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810687980.5A CN108958965B (zh) 2018-06-28 2018-06-28 一种bmc监控可恢复ecc错误的方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108958965A CN108958965A (zh) 2018-12-07
CN108958965B true CN108958965B (zh) 2021-03-02

Family

ID=64487637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810687980.5A Active CN108958965B (zh) 2018-06-28 2018-06-28 一种bmc监控可恢复ecc错误的方法、装置及设备

Country Status (2)

Country Link
CN (1) CN108958965B (zh)
WO (1) WO2020000956A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108958965B (zh) * 2018-06-28 2021-03-02 苏州浪潮智能科技有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备
CN109992477B (zh) * 2019-03-27 2021-07-16 联想(北京)有限公司 用于电子设备的信息处理方法、系统以及电子设备
CN110674005A (zh) * 2019-08-30 2020-01-10 苏州浪潮智能科技有限公司 一种监控服务器内存的方法、设备及可读介质
CN111858239B (zh) * 2020-06-30 2022-06-10 浪潮电子信息产业股份有限公司 一种服务器硬盘监测方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的系统和方法
TW200743025A (en) * 2006-05-09 2007-11-16 Giga Byte Tech Co Ltd Method for simulating IPMI using BIOS
CN104753698A (zh) * 2013-12-26 2015-07-01 鸿富锦精密工业(深圳)有限公司 系统事件日志记录系统及方法
US9343181B2 (en) * 2013-08-30 2016-05-17 Hewlett Packard Enterprise Development Lp Memory module errors
CN105589789A (zh) * 2015-12-25 2016-05-18 浪潮电子信息产业股份有限公司 一种动态调整内存监控阀值的方法
CN107357671A (zh) * 2014-06-24 2017-11-17 华为技术有限公司 一种故障处理方法、相关装置及计算机
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、系统、装置及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7600110B2 (en) * 2006-07-11 2009-10-06 Giga-Byte Technology Co., Ltd. Method for simulating an intelligent platform management interface using BIOS
CN102968354A (zh) * 2012-11-13 2013-03-13 浪潮电子信息产业股份有限公司 一种基于Intel Brickland-EX平台的同频锁步模式的自动切换方法
US20150193336A1 (en) * 2014-01-06 2015-07-09 Hon Hai Precision Industry Co., Ltd. Computing device and method for recording system event logs of computing device
US9812222B2 (en) * 2015-04-20 2017-11-07 Qualcomm Incorporated Method and apparatus for in-system management and repair of semi-conductor memory failure
CN107943610A (zh) * 2017-10-25 2018-04-20 记忆科技(深圳)有限公司 一种提升ssd综合性能的方法
CN108958965B (zh) * 2018-06-28 2021-03-02 苏州浪潮智能科技有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的系统和方法
TW200743025A (en) * 2006-05-09 2007-11-16 Giga Byte Tech Co Ltd Method for simulating IPMI using BIOS
US9343181B2 (en) * 2013-08-30 2016-05-17 Hewlett Packard Enterprise Development Lp Memory module errors
CN104753698A (zh) * 2013-12-26 2015-07-01 鸿富锦精密工业(深圳)有限公司 系统事件日志记录系统及方法
CN107357671A (zh) * 2014-06-24 2017-11-17 华为技术有限公司 一种故障处理方法、相关装置及计算机
CN105589789A (zh) * 2015-12-25 2016-05-18 浪潮电子信息产业股份有限公司 一种动态调整内存监控阀值的方法
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、系统、装置及存储介质

Also Published As

Publication number Publication date
WO2020000956A1 (zh) 2020-01-02
CN108958965A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN108958965B (zh) 一种bmc监控可恢复ecc错误的方法、装置及设备
US11360842B2 (en) Fault processing method, related apparatus, and computer
CN110515820B (zh) 一种服务器故障维护方法、装置、服务器及存储介质
WO2021003822A1 (zh) 数据存储及恢复的方法、装置及计算机设备
CN106682162B (zh) 日志管理方法及装置
CN110909394B (zh) 一种服务器的配置文件监测方法、装置、设备及存储介质
CN108509322B (zh) 避免过度回访的方法、电子装置及计算机可读存储介质
CN115981898A (zh) 一种内存可纠错误处理方法、装置、设备及可读存储介质
US20150074808A1 (en) Rootkit Detection in a Computer Network
CN109558209B (zh) 一种用于虚拟机的监控方法
CN111813592A (zh) 系统故障恢复预案的优化方法、装置及计算机存储介质
CN111400153A (zh) 一种串口日志的启动方法、装置和计算机可读存储介质
CN114415970B (zh) 分布式存储系统的磁盘故障处理方法、装置及服务器
CN111221680A (zh) 一种数据中心交换机系统自动管理方法及装置
CN114625702A (zh) 数据的存储方法、装置、系统及电子设备
CN111984473A (zh) 一种内存快照数据获取方法及相关装置
CN115599310B (zh) 存储节点中存储资源的控制方法、装置以及存储节点
CN110851300A (zh) 程序进程监控的方法、装置、计算机设备及可读存储介质
CN115329391B (zh) 一种文本数据库的防护方法、装置、设备及介质
CN110647526B (zh) 批量数据处理方法、装置、计算机设备及存储介质
CN117235021A (zh) 一种信息存储方法、客户端及服务端
CN115016971A (zh) 应用程序的异常修复方法、装置、存储介质及计算机设备
CN117170921A (zh) 设备可纠正错误处理方法、装置、计算机设备及存储介质
CN116302643A (zh) 看门狗重启触发原因的定位方法、装置、设备及存储介质
CN112463308A (zh) 一种虚拟机快照方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201230

Address after: Building 9, No.1, guanpu Road, Guoxiang street, Wuzhong Economic Development Zone, Wuzhong District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: Room 1601, floor 16, 278 Xinyi Road, Zhengdong New District, Zhengzhou City, Henan Province

Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant