CN107066362B - 一种自动处理故障内存条的方法 - Google Patents

一种自动处理故障内存条的方法 Download PDF

Info

Publication number
CN107066362B
CN107066362B CN201710254218.3A CN201710254218A CN107066362B CN 107066362 B CN107066362 B CN 107066362B CN 201710254218 A CN201710254218 A CN 201710254218A CN 107066362 B CN107066362 B CN 107066362B
Authority
CN
China
Prior art keywords
memory
memory bank
dimm slot
dimm
gpio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710254218.3A
Other languages
English (en)
Other versions
CN107066362A (zh
Inventor
马井彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tongtaiyi Information Technology Co ltd
Original Assignee
Shenzhen Tongtaiyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tongtaiyi Information Technology Co ltd filed Critical Shenzhen Tongtaiyi Information Technology Co ltd
Priority to CN201710254218.3A priority Critical patent/CN107066362B/zh
Publication of CN107066362A publication Critical patent/CN107066362A/zh
Application granted granted Critical
Publication of CN107066362B publication Critical patent/CN107066362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2247Verification or detection of system hardware configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供了一种自动处理故障内存条的方法,每条DIMM插槽对应设置一个LED指示灯,每个LED指示灯的负极均接地,每个LED指示灯的正极均与CPLD连接,系统南桥PCH通过GPIO与CPLD连接;系统在开机过程中,CPLD控制DIMM插槽的指示灯状态,并对内存进行在位检测,初始化内存条,发现有内存条故障、内存条类型不被支持等问题,软件程序将对故障内存条进行禁止,通过设置的指示灯来指示对应出现故障的内存条,且程序将进行对下一根内存条进行初始化,直到所有内存条初始化完成,启动系统。采用此技术方案,系统不会因为存在故障内存条而宕机,不影响系统的正常使用,同时将故障内存条通过指示灯进行标识。

Description

一种自动处理故障内存条的方法
技术领域
本发明属于计算机技术领域,尤其涉及一种自动处理故障内存条的方法。
背景技术
内存条是服务器主板最重要的部件之一,主板上电启动以后,内存资源还没有被初始化,没有内存资源可以使用,程序在非易失性存储介质中缓慢运行,为了能尽早获取内存资源,将程序复制到内存中快速运行,主板启动后,会优先初始化内存设备,把其他设备初始化工作放在后面。主板上,至少会配置一根内存条,满配时可以达到几十根内存条,主板逐一对每一根内存条初始化,任何一根内存条出现故障,都无法初始化完成,系统就会宕机。
主板上电启动后,进行最必要的初始化后,就开始检测内存条是否正常,如果所有插入DIMM插槽上的内存条都是正常的,然后再检查其他设备,例如显示控制器等。在检测内存条过程中,如果检测出没有内存条、有内存条损坏或者有内存条类型不被主板支持等错误,BIOS将停止运行,此时显示控制器还没有被检测,因此显示器不会被点亮。用户所能看到的是主板已经上电,风扇旋转,但是显示器不亮,鼠标键盘无法使用,没有故障点线索,这给用户带来了比较大的麻烦,需要逐一排查问题点,即使排查到内存条的问题,几十根内存条,逐条排查,整个过程需要耗费大量时间,甚至需要设备厂商的技术支持才行。
发明内容
针对以上技术问题,本发明公开了一种自动处理故障内存条的方法,系统不会因为存在故障内存条而宕机,不影响系统的正常使用,同时将故障内存条通过指示灯进行标识,方便用户排查故障内存条进行替换,大大降低了排查主板错误的技术难度,简单便捷,快速高效。
对此,本发明采用的技术方案为:
一种自动处理故障内存条的方法,每条DIMM插槽对应设置一个LED指示灯,每个LED指示灯的负极均接地,每个LED指示灯的正极均与CPLD连接,系统南桥PCH通过GPIO与CPLD连接;系统在开机过程中,CPLD将GPIO信号解码到对应的DIMM插槽状态,控制对应DIMM插槽的指示灯状态,并采用以下步骤自动处理故障内存条:
步骤S1,启动BIOS,对GPIO进行初始化;
步骤S2,初始化SMI,初始化内存控制器;
步骤S3,将当前的处理器寄存器状态进行保存到存储区,逐一侦测各个DIMM插槽内的内存条是否在位;如果该DIMM插槽的内存条在位,则将该DIMM插槽对应的LED设置为闪烁,并注册周期性SMI程序,初始化该DIMM插槽的内存条;如果该DIMM插槽的内存条不在位,则将该DIMM插槽对应的LED设置为不点亮;
步骤S4,如果DIMM插槽内的内存初始化正常,通过CPLD控制该DIMM插槽对应的LED指示灯为点亮状态,清除保存在存储区的处理器寄存器状态数据,卸载周期性内存处理的SMI程序;
如果内存初始化在SMI程序的周期时间间隔到来时未完成,则认为内存条初始化出现故障,周期性SMI中断触发,进入SMM系统,执行周期性内存处理的SMI程序,将该故障DIMM插槽的内存禁止,将DIMM插槽的号码n增加1,指向下一个DIMM插槽,并读取存储区中的寄存器状态的数据,退出SMI程序,将所有寄存器值恢复成存储区读取出来的寄存器的值;
步骤S5,重复步骤S3~步骤S4的内容进行下一个DIMM插槽的内存的检查。
采用此技术方案,针对内存条无法初始化完成,导致系统宕机的问题,给出了解决方案。主板初始化内存条,发现有内存条故障、内存条类型不被支持等问题,软件程序将对故障内存条进行禁止,同时设置指示灯来表明对应DIMM内存条出现故障,程序将进行对下一根内存条进行初始化,直到所有内存条初始化完成,启动系统。应用此方法,系统不会因为存在故障内存条而宕机,不影响系统的正常使用,同时将故障内存条通过指示灯进行标识,方便用户排查故障内存条进行替换,大大降低排查主板错误的技术难度,简单便捷,快速高效。
作为本发明的进一步改进,所述系统南桥PCH通过LED片选GPIO、LED控制GPIO与CPLD连接;步骤S1中,对GPIO进行初始化后将LED片选GPIO、LED控制GPIO设置为输出功能。
作为本发明的进一步改进,步骤S3中,所述逐一侦测各个DIMM插槽内的内存条是否在位是通过BIOS读取DIMM插槽的SPD数据,来检测DIMM插槽内存条的在位状态;如果能正常获取有效的SPD数据,表明DIMM的内存条在位,如果不能获取有效SPD数据,表明DIMM插槽上没有内存条在位,并根据DIMM插槽的序号n值,来设置该DIMM插槽对应的LED片选GPIO的输出电平值,传送给CPLD处理,将该DIMM插槽对应的LED设置为不点亮。
作为本发明的进一步改进,如果该DIMM插槽的内存条不在位,则将该DIMM插槽对应的LED片选GPIO设置为低电平,传送给CPLD处理,将该DIMM插槽对应的LED设置为不点亮;清除存储区存储的处理器寄存器状态数据,接下来判断是否周期性内存处理的SMI程序已经注册,如果有,就将周期性SMI程序卸载掉,如果没有,继续检测是否所有DIMM插槽都完成在位检测。
作为本发明的进一步改进,步骤S3中,所述处理器寄存器包括CS和IP两个寄存器。
作为本发明的进一步改进,步骤S5还包括判断是否所有DIMM插槽的内存检查完毕,如果检查完毕,程序结束;如果还有DIMM插槽的内存未检查完成,循环执行步骤S3~步骤S4的内容进行下一个DIMM插槽的内存的检查。
作为本发明的进一步改进,所述DIMM插槽的数量为n,所述LED指示灯的数量为n,所述LED片选GPIO的数量为x,其中x= log2 n;所述LED控制GPIO为1个。
作为本发明的进一步改进,所述SMI程序的周期为DIMM插槽的内存初始化需要的时间与预留余量时间之和。
与现有技术相比,本发明的有益效果为:
采用本发明的技术方案,主板初始化内存条,发现有内存条故障、内存条类型不被支持等问题,软件程序将对故障内存条进行禁止,通过设置的指示灯来指示对应出现故障的DIMM内存条,且程序将进行对下一根内存条进行初始化,直到所有内存条初始化完成,启动系统。应用此方法,解决了现有技术内存条故障无法完成初始化,导致系统宕机的问题;系统不会因为存在故障内存条而宕机,不影响系统的正常使用,同时将故障内存条通过指示灯进行标识,方便用户排查故障内存条进行替换,大大降低排查主板错误的技术难度,简单便捷,快速高效。
附图说明
图1是本发明一种实施例的主板硬件部分改进的结构示意图。
图2是本发明一种自动处理故障内存条的方法的流程图。
具体实施方式
下面对本发明的较优的实施例作进一步的详细说明。
一种自动处理故障内存条的方法,其包括硬件设计部分和BIOS程序部分。
如图1所示,硬件设计上,将主板上每一根DIMM插槽旁边放置一个发光二极管,作为指示灯,用以表示DIMM插槽上内存条的状态,有n个DIMM插槽就用n个发光二极管,所有发光二极管负极统一接地,每个发光二极管的正极都连接到CPLD 的pin上面,n个发光二极管对应n个CPLD pin角,n个DIMM,需要x个GPIO进行片选 ,2x = n,x = log2 n,例如有32根DIMM,需要片选GPIO的数量x = log2 32 = 5,再加上一个指示灯控制GPIO,就是6个GPIO,这6个GPIO从PCH,连接到CPLD,每次当软件设置完GPIO后,CPLD将GPIO信号解码到对应的DIMM插槽和控制指示灯状态。使用CPLD来解码GPIO控制片选DIMM插槽和指示灯控制,节省了PCHGPIO的用量,避免当几十根DIMM时,GPIO数量不够的情况,而CPLD解码仅仅是很小的一个逻辑功能,不会影响CPLD的其他功能运用。
如图2所示,BIOS程序采用以下步骤:
BIOS启动以后,首先对GPIO进行初始化,将使用到的GPIO设置为输出功能,接着初始化SMI,使SMI中断触发后,中断程序正常使用,接着对内存控制器进行初始化。接下来的步骤,应该是逐一侦测内存条是否在位,然后进行初始化的过程了,在进行这一步骤之前,首先对当前的处理器寄存器状态进行保存到存储区,其中最重要的是CS和IP两个寄存器,这两个寄存器保存着处理器的正在运行指令的指针。开始读取DIMM n内存条的SPD,如果能正常获取有效SPD数据,表明DIMM上有内存条在位,如果不能获取有效SPD数据,表明DIMM上没有内存条在位,根据n值,来设置片选GPIO的输出电平值,传送给CPLD处理,来选择DIMM n的指示灯来控制。如果判断DIMM n不在位,将指示灯控制GPIO设置为低电平,传递给CPLD处理,让CPLD将指示灯熄灭,清除存储区存储的处理器寄存器状态数据,接了来判断是否有周期性内存处理的SMI程序已经注册,如果有,就将周期性SMI程序卸载掉,如果没有继续执行,检测是否所有DIMM都完成。如果判断DIMM n在位,将指示灯控制GPIO设置为闪烁状态,传递给CPLD处理,让CPLD设置指示灯为闪烁,接下来注册周期性内存处理的SMI程序,SMI程序的周期间隔是经验值,根据实际每根DIMM初始化需要的时间,再预留一定余量来设置,注册完成以后,开始初始化DIMM n内存条,这里出现两个分支,如果初始化正常,内存条没有故障,将指示灯控制GPIO设置为高电平,传递给CPLD处理,让指示灯点亮,表明内存条是正常的,清除保存在存储区的处理器寄存器状态数据,卸载周期性内存处理的SMI程序,检测是否所有DIMM都完成,如果内存初始化在周期性SMI程序时间间隔到来是未完成,程序认为内存条初始化出现故障,周期性SMI中断触发,进入SMM系统,执行周期性内存处理的SMI程序,在程序里面,将故障DIMM n禁止掉,将DIMM号码n增加1,指向下一个DIMM,读取在存储区保存的处理器寄存器状态数据,使用这些数据修改替换掉进入SMM系统时保存在SMRAM里的处理器寄存器状态数据,退出SMM系统,因为SMRAM里的处理器状态信息数据已经被替换了,尤其是表示处理器执行当前指令CS和IP寄存器,,所以处理器返回的位置将会跳到保存处理器寄存器数据的位置,在这里继续执行,对下一个DIMM内存条进行处理。判断是否所有DIMM检查完毕,如果检查完毕,程序结束,如果还有DIMM未检查完成,循环执行上面的程序流程。
本发明中所涉及的英文缩写解释如下:
PCH (Platform Controller Hub) :Intel公司的集成南桥
BIOS(Basic Input Output System):基本输入输出系统,主要用于计算机开机过程中各种硬件设备的初始化和检测
GPIO(General Purpose Input Output):通用输入/输出.
DIMM(Dual Inline Memory Modules):双列直插式存储模块,即通常看到的主板上面的内存条。.
SMI(System Management Interrupt):系统管理中断;
SMM(System Management Mode):系统管理模式。
SMRAM(System Management RAM):系统管理内存。
CPLD(Complex Programmable Logic Device):复杂可编程逻辑器件。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (6)

1.一种自动处理故障内存条的方法,其特征在于:每条DIMM插槽对应设置一个LED指示灯,每个LED指示灯的负极均接地,每个LED指示灯的正极均与CPLD连接,系统南桥PCH通过GPIO与CPLD连接;系统在开机过程中,CPLD将GPIO信号解码到对应的DIMM插槽状态,控制对应DIMM插槽的指示灯状态,采用以下步骤自动处理故障内存条:
步骤S1,启动BIOS,对GPIO进行初始化;
步骤S2,初始化SMI,初始化内存控制器;
步骤S3,将当前的处理器寄存器状态进行保存到存储区,逐一侦测各个DIMM插槽内的内存条是否在位;如果该DIMM插槽的内存条在位,则将该DIMM插槽对应的LED设置为闪烁,并注册周期性SMI程序,初始化该DIMM插槽的内存条;如果该DIMM插槽的内存条不在位,则将该DIMM插槽对应的LED设置为不点亮;
步骤S4,如果DIMM插槽内的内存初始化正常,通过CPLD控制该DIMM插槽对应的LED指示灯为点亮状态,清除保存在存储区的处理器寄存器状态数据,卸载周期性内存处理的SMI程序;
如果内存初始化在SMI程序的周期时间间隔到来时未完成,则认为内存条初始化出现故障,周期性SMI中断触发,进入SMM系统,执行周期性内存处理的SMI程序,将该故障DIMM插槽的内存禁止,将DIMM插槽的号码n增加1,指向下一个DIMM插槽,并读取存储区中的寄存器状态的数据,退出SMI程序,将所有寄存器值恢复成存储区读取出来的寄存器的值;
步骤S5,重复步骤S3~步骤S4的内容进行下一个DIMM插槽的内存的检查;
步骤S3中,所述逐一侦测各个DIMM插槽内的内存条是否在位是通过BIOS读取DIMM插槽的SPD数据,来检测DIMM插槽内存条的在位状态;如果能正常获取有效的SPD数据,表明DIMM的内存条在位,如果不能获取有效的SPD数据,表明DIMM插槽上没有内存条在位,并根据DIMM插槽的序号n值,来设置该DIMM插槽对应的LED片选GPIO的输出电平值,传送给CPLD处理,将该DIMM插槽对应的LED设置为不点亮;
如果该DIMM插槽的内存条不在位,则将该DIMM插槽对应的LED片选GPIO设置为低电平,传送给CPLD处理,将该DIMM插槽对应的LED设置为不点亮;清除存储区存储的处理器寄存器状态数据,接下来判断是否周期性内存处理的SMI程序已经注册,如果已经注册,就将周期性SMI程序卸载掉,如果没有注册,继续检测是否所有DIMM插槽都完成在位检测。
2.根据权利要求1所述的自动处理故障内存条的方法,其特征在于:所述系统南桥PCH通过LED片选GPIO、LED控制GPIO与CPLD连接;步骤S1中,对GPIO进行初始化后将LED片选GPIO、LED控制GPIO设置为输出功能。
3.根据权利要求2所述的自动处理故障内存条的方法,其特征在于:步骤S3中,所述处理器寄存器包括CS和IP两个寄存器。
4.根据权利要求3所述的自动处理故障内存条的方法,其特征在于:步骤S5还包括判断是否所有DIMM插槽的内存检查完毕,如果检查完毕,程序结束;如果还有DIMM插槽的内存未检查完成,循环执行步骤S3~步骤S4的内容进行下一个DIMM插槽的内存的检查。
5.根据权利要求2~4任意一项所述的自动处理故障内存条的方法,其特征在于:所述DIMM插槽的数量为n,所述LED指示灯的数量为n,所述LED片选GPIO的数量为x,其中x=log2 n;所述LED控制GPIO为1个。
6.根据权利要求5所述的自动处理故障内存条的方法,其特征在于:所述SMI程序的周期为DIMM插槽的内存初始化需要的时间与预留余量时间之和。
CN201710254218.3A 2017-04-18 2017-04-18 一种自动处理故障内存条的方法 Active CN107066362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710254218.3A CN107066362B (zh) 2017-04-18 2017-04-18 一种自动处理故障内存条的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710254218.3A CN107066362B (zh) 2017-04-18 2017-04-18 一种自动处理故障内存条的方法

Publications (2)

Publication Number Publication Date
CN107066362A CN107066362A (zh) 2017-08-18
CN107066362B true CN107066362B (zh) 2020-04-21

Family

ID=59599735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710254218.3A Active CN107066362B (zh) 2017-04-18 2017-04-18 一种自动处理故障内存条的方法

Country Status (1)

Country Link
CN (1) CN107066362B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577584A (zh) * 2017-09-13 2018-01-12 深圳市嘉合劲威电子科技有限公司 基于smbus总线的内存条同步发光方法及装置
CN107992399A (zh) * 2017-12-12 2018-05-04 郑州云海信息技术有限公司 一种内存条状态检测方法、装置及系统
CN108255684A (zh) * 2018-01-10 2018-07-06 郑州云海信息技术有限公司 一种用于显示大型机系统状态的装置及显示方法
CN108762407B (zh) * 2018-04-28 2020-05-15 华勤通讯技术有限公司 电路板组件、板卡及电子设备
CN109139528B (zh) * 2018-09-25 2024-03-22 东莞市觅智智能家居有限公司 一种风扇检测系统及检测方法
CN109408130A (zh) * 2018-12-18 2019-03-01 广东浪潮大数据研究有限公司 一种bios的启动方法、启动系统及相关装置
CN110472421B (zh) * 2019-07-22 2021-08-20 深圳中电长城信息安全系统有限公司 主板、固件安全检测方法及终端设备
CN111597086A (zh) * 2020-04-26 2020-08-28 深圳市同泰怡信息技术有限公司 基于cpld的内存报错方法、装置、存储介质和计算机设备
CN115080285A (zh) * 2021-03-12 2022-09-20 深圳市云海麒麟计算机系统有限公司 一种快速处理故障pci-e卡板的方法
CN113904998B (zh) * 2021-09-29 2023-10-27 杭州迪普科技股份有限公司 一种交换机状态指示方法及装置
CN115292113B (zh) * 2022-09-30 2023-01-06 新华三信息技术有限公司 对服务器的内存进行故障检测方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708031A (zh) * 2012-05-15 2012-10-03 浪潮电子信息产业股份有限公司 一种快速定位故障内存的硬件实现方法
CN103019898A (zh) * 2012-11-26 2013-04-03 加弘科技咨询(上海)有限公司 内存模块检测及槽位红绿灯定位报错系统
CN203573310U (zh) * 2013-11-28 2014-04-30 曙光信息产业(北京)有限公司 一种内存条安装故障的检测系统
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708031A (zh) * 2012-05-15 2012-10-03 浪潮电子信息产业股份有限公司 一种快速定位故障内存的硬件实现方法
CN103019898A (zh) * 2012-11-26 2013-04-03 加弘科技咨询(上海)有限公司 内存模块检测及槽位红绿灯定位报错系统
CN203573310U (zh) * 2013-11-28 2014-04-30 曙光信息产业(北京)有限公司 一种内存条安装故障的检测系统
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统

Also Published As

Publication number Publication date
CN107066362A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
CN107066362B (zh) 一种自动处理故障内存条的方法
JP6530774B2 (ja) ハードウェア障害回復システム
US6161177A (en) Method for selecting, detecting and/or reprogramming system BIOS in a computer system
US9158628B2 (en) Bios failover update with service processor having direct serial peripheral interface (SPI) access
US10713128B2 (en) Error recovery in volatile memory regions
US8468389B2 (en) Firmware recovery system and method of baseboard management controller of computing device
US6360333B1 (en) Method and apparatus for determining a processor failure in a multiprocessor computer
US10068661B2 (en) Post package repair (PPR) data in non-volatile memory
CN110083494B (zh) 在多核心环境中管理硬件错误的方法和装置
US7984219B2 (en) Enhanced CPU RASUM feature in ISS servers
CN101369240A (zh) 用于在信息处理系统中管理存储错误的系统和方法
US20140095948A1 (en) Memory testing in a data processing system
US6725396B2 (en) Identifying field replaceable units responsible for faults detected with processor timeouts utilizing IPL boot progress indicator status
US20220269565A1 (en) Methods and systems for preventing hangup in a post routine from faulty bios settings
US11379330B2 (en) Information handling systems and related methods for testing memory during boot and during operating system (OS) runtime
US7290128B2 (en) Fault resilient boot method for multi-rail processors in a computer system by disabling processor with the failed voltage regulator to control rebooting of the processors
US10635553B2 (en) Error recovery in non-volatile storage partitions
CN113454724A (zh) 用于存储器的运行时封装后修复
US7831858B2 (en) Extended fault resilience for a platform
US10777296B2 (en) Information handling system and method to dynamically detect and recover from thermally induced memory failures
CN114138527A (zh) 一种提高服务器性能的方法、装置及介质
US8495353B2 (en) Method and circuit for resetting register
CN113377586A (zh) 一种服务器自动化检测方法、装置及存储介质
US20080276121A1 (en) Method and infrastructure for recognition of the resources of a defective hardware unit
CN101923503B (zh) 调整内存内部参数的方法及使用其的电脑系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant