CN117421189A - 失败信息的记录方法和装置、存储介质及电子装置 - Google Patents

失败信息的记录方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN117421189A
CN117421189A CN202311459801.XA CN202311459801A CN117421189A CN 117421189 A CN117421189 A CN 117421189A CN 202311459801 A CN202311459801 A CN 202311459801A CN 117421189 A CN117421189 A CN 117421189A
Authority
CN
China
Prior art keywords
failure information
memory
initialization failure
information
initialization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311459801.XA
Other languages
English (en)
Inventor
徐胜军
张炳会
周春芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311459801.XA priority Critical patent/CN117421189A/zh
Publication of CN117421189A publication Critical patent/CN117421189A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4403Processor initialisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种失败信息的记录方法和装置、存储介质及电子装置,其中,该失败信息的记录方法包括:在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,物理层微型控制单元用于对服务器的内存模块进行管理;将初始化失败信息保存至基本输入输出系统的预设内存中预先创建的目标数据结构;在基本输入输出系统的第二启动阶段,将初始化失败信息发送到预设显示窗口上进行显示,以及将初始化失败信息发送到基板管理控制器进行记录。解决了现有技术中,PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题。

Description

失败信息的记录方法和装置、存储介质及电子装置
技术领域
本申请实施例涉及存储领域,具体而言,涉及一种失败信息的记录方法和装置、存储介质及电子装置。
背景技术
在服务器整机的设计中,一个稳定的产品除了依赖严谨的主板设计原理,还需要中央处理器(Central Processing Unit,简称为CPU)在读取各个部件的数据时能够稳定准确,也只有这样才能发挥出CPU最大的性能。但是在一个新的CPU平台上,总是会存在各种各样的CPU与部件之间的配合问题,这就需要CPU能够更多的记录下来机器使用过程中的报错日志,从而通过基本输入输出系统(Basic Output and lnput,简称为BIOS)让项目开发人员以及运维人员能够清晰的看到具体是哪一部分发生了错误,从而可以定位到具体的部件。
对于超威半导体公司(Advanced Micro Devices,lnc,简称为AMD)的Genoa平台对部件的数据读取中,相较于Milan平台其最大的不同就是双倍数据速率第五代(DoubleData Rate 5,简称为DDR5)内存的适配。DDR5内存对比双倍数据速率第四代(Double DataRate 4,简称为DDR4)在数据的读取、写入、复制以及延时方面都有很大的提升。不过相比较于DDR4内存,DDR5内存的稳定性会差一些。在服务器整机上,CPU对内存的初始化过程中,DDR5的失败几率要高于DDR4,在使用过程中DDR5更容易触发一些错误检测和纠正(ErrorChecking and Correction,简称为ECC)报错以及更严重的电源管理集成电路(PowerManagement Integrated Circuit,简称为PMIC)报错。在现实使用中,内存初始化fail最多的阶段是物理层微型控制单元(Phy Micro-controller Unit,简称为PMU)初始化阶段了,于是针对PMU的初始化失败(fail),CPU进行了详细的检测和划分,从而输出更详细的fail日志记录。
相关技术中,内存初始化的时候,只有在跑内存眼图测试的时候CPU才能明确记录下来内存PMU初始化失败的报错。由于内存眼图的测试需要依赖使能BIOS和可编程逻辑器件(Complex Programmable Logic Device,简称为CPLD)的部分特定功能才能正常运行,故正常发布到客户使用的机器开机过程中是无法显示内存PMU初始化失败的报错信息的。此外,在可以执行内存眼图测试的环境中,内存眼图测试的PMU初始化数据不会记录在CPU寄存器中,那么机器在开机到post阶段,BIOS就无法轮询获取对应的信息,从而无法通过智能平台管理接口(Intelligent Platform Management Interface,简称为IPMI)交互的方式将内存报错信息发送给基板管理控制器(Baseboard Management Controller,简称为BMC)记录在BMC web上,不利于内存问题的debug分析。
针对现有技术中,PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题,尚未得到有效解决。
发明内容
本申请实施例提供了一种失败信息的记录方法和装置、存储介质及电子装置,以至少解决现有技术中PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题。
根据本申请的一个实施例,提供了一种失败信息的记录方法,包括:在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
在一个示例性实施例中,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,包括:确定所述中央处理器的目标引脚的电平状态变化,其中,所述目标引脚是所述物理层微型控制单元连接到所述中央处理器的引脚;在所述电平状态变化指示所述目标引脚的电平从高电平状态变为低电平状态的情况下,通过目标函数扫描所述目标引脚的相关信息,并将所述相关信息确定为所述初始化失败信息,其中,所述相关信息至少包括:所述目标引脚所在的中央处理器信息、所述物理层微型控制单元对应的内存槽位信息、所述物理层微型控制单元的错误类型信息。
在一个示例性实施例中,将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构,包括:为所述初始化失败信息分配标识信息,并将所述标识信息和所述初始化失败信息打包成数据块,其中,所述标识信息用于在存在多个初始化失败信息的情况下,标识所述初始化失败信息对应的所述数据块;确定所述目标数据结构在所述预设内存中的地址信息;根据所述地址信息将所述数据块保存到所述目标数据结构中。
在一个示例性实施例中,将所述初始化失败信息发送到基板管理控制器进行记录,包括:按照所述标识信息和所述地址信息从所述目标数据结构中获取所述初始化失败信息;将所述初始化失败信息记录到系统事件日志中,其中,所述系统事件日志是通过所述基本输入输出系统和所述基板管理控制器共同进行日志形式定制的日志,所述系统事件日志至少还记载有以下信息:所述系统事件日志的日志标识、所述初始化失败信息的信息版本、所述基板管理控制器接收所述系统事件日志的传感器类型;将所述系统事件日志发送到所述基板管理控制器,以使得所述基板管理控制器记录所述初始化失败信息。
在一个示例性实施例中,将所述初始化失败信息发送到基板管理控制器进行记录之后,所述方法还包括:确定所述目标数据结构中保存的所有所述初始化失败信息的数量M,其中,M为正整数;确定将所述初始化失败信息发送到基板管理控制器的发送次数N,其中,N为非负整数;确定M和N的大小关系;在所述大小关系指示M与N相等的情况下,将所有所述初始化失败信息对应的M个内存模块隔离,其中,所述M个内存模块中的每个内存模块都通过一个物理层微型控制单元与所述中央处理器通信。
在一个示例性实施例中,对中央处理器进行扫描之后,所述方法还包括:在未获取到所述初始化失败信息的情况下,确定所述物理层微型控制单元以及所述物理层微型控制单元所管理的内存模块初始化成功;按照预设训练方式对所述内存模块进行内存训练;在所述内存训练结束的情况下,测试所述内存模块的内存性能;在所述内存性能达到预设性能标准的情况下,确定所述中央处理器可以与所述内存模块进行的数据交互。
在一个示例性实施例中,对中央处理器进行扫描之前,所述方法还包括:确定所述基板管理控制器的是否可以执行以下至少之一操作:登录操作、温度的获取操作、数量获取操作,其中,所述温度用于指示所述基本输入输出系统和所述基板管理控制器所在的服务器中的中央处理器温度或网卡温度,所述数量用于指示所述服务器中目标部件的数量;在所述基板管理控制器可以执行所述操作的情况下,确定所述基板管理控制器处于正常工作状态。
根据本申请的另一个实施例,提供了一种失败信息的记录装置,包括:扫描模块,用于在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;保存模块,用于将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;发送模块,用于在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。因此,可以解决现有技术中,PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题。使得PMU的初始化失败信息能够保存到第二启动阶段,进而达到对初始化失败信息进行显示和记录的技术效果。
附图说明
图1是本申请实施例的一种失败信息的记录方法的计算机终端的硬件结构框图;
图2是根据本申请实施例的失败信息的记录方法的流程图(一);
图3是根据本申请实施例的失败信息的记录方法的流程图(二);
图4是根据本申请实施例的失败信息的记录方法的流程图(三);
图5是根据本申请实施例的失败信息的记录方法的流程图(四);
图6是根据本申请实施例的失败信息的记录装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语″第一″、″第二″等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本申请实施例的一种失败信息的记录方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的负载资源的分配方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
图2是根据本申请实施例的失败信息的记录方法的流程图(一),如图2所示,该流程包括如下步骤:
步骤S202,在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;
步骤S204,将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;
步骤S206,在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
通过上述步骤,在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。因此,可以解决现有技术中,PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题。使得PMU的初始化失败信息能够保存到第二启动阶段,进而达到对初始化失败信息进行显示和记录的技术效果。
针对上述步骤S202,可以通过多种实施方式实现,在一个可选实施例中,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,包括:确定所述中央处理器的目标引脚的电平状态变化,其中,所述目标引脚是所述物理层微型控制单元连接到所述中央处理器的引脚;在所述电平状态变化指示所述目标引脚的电平从高电平状态变为低电平状态的情况下,通过目标函数扫描所述目标引脚的相关信息,并将所述相关信息确定为所述初始化失败信息,其中,所述相关信息至少包括:所述目标引脚所在的中央处理器信息、所述物理层微型控制单元对应的内存槽位信息、所述物理层微型控制单元的错误类型信息。
需要进行说明的是,在服务器中,内存模块插接在内存槽位上,内存模块通过物理层微型控制单元与中央处理器通信。在CPU对内存模块进行初始化的过程中,如果出现PMU初始化失败,就会触发CPU特定引脚(相当于上述实施例中的目标引脚)的电平状态变化,具体的,该特定引脚会从高电平状态变化到低电平状态。
针对PMU初始化失败的情况,BIOS在开机后的PEI阶段,会初始化AmdErrorLogService服务,通过目标函数扫描PMU的初始化失败信息;以及在BIOS的预留内存中创建目标数据结构,用于保存初始化失败信息。目标函数函数名称为:″AmdErrorLogDisplayRsDxelnit″。目标数据结构可以选择数据结构(Hand-Off-Block,简称为HOB)。需要说明的是,PEI(Pre-EFI Initialization)是BIOS启动过程中的EFI前期初始化阶段。
本申请实施例通过初始化失败这一事件导致的电平状态变化,快速准确的确定PMU初始化结果,从而使得BIOS可以及时的通过目标函数扫描得到初始化失败信息,避免了初始化失败信息的遗漏。
针对上述步骤S204,将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构,包括:为所述初始化失败信息分配标识信息,并将所述标识信息和所述初始化失败信息打包成数据块,其中,所述标识信息用于在存在多个初始化失败信息的情况下,标识所述初始化失败信息对应的所述数据块;确定所述目标数据结构在所述预设内存中的地址信息;根据所述地址信息将所述数据块保存到所述目标数据结构中。
可以理解的是,BIOS中存在预设内存,创建目标数据结构时会同时得到目标数据结构在预设内存中的地址。进而BIOS在获取初始化失败信息之后,为初始化失败信息分配标识信息,以唯一标识该初始化失败信息。将标识信息和初始化失败信息打包为数据块,按照地址信息保存在目标数据结构中。具体的打包方式可以采用压缩打包、加密打包,以及压缩并且加密打包等形式,本申请实施例对此不进行限定。
可选的,本申请实施例中的一种打包流程也可以采用打包后分配标识信息的方式,具体地:
步骤1:选择所述初始化失败信息,运行格式为″.pack″的打包命令。
步骤2:设置打包方式:打包方式包括以下之一:压缩打包、加密打包,以及压缩并且加密打包。其中,打包方式也可以在打包命令中预先设置好。
步骤3:执行打包,并将打包后的文件的文件名输出为分配得到的标识信息,将打包后的文件输出到地址信息所指向的路径/文件夹/预设内存位置。
进一步的,在第一启动阶段保存好所述初始化失败信息之后,在第二启动阶段,将所述初始化失败信息发送到基板管理控制器进行记录,包括:按照所述标识信息和所述地址信息从所述目标数据结构中获取所述初始化失败信息;将所述初始化失败信息记录到系统事件日志中,其中,所述系统事件日志是通过所述基本输入输出系统和所述基板管理控制器共同进行日志形式定制的日志,所述系统事件日志至少还记载有以下信息:所述系统事件日志的日志标识、所述初始化失败信息的信息版本、所述基板管理控制器接收所述系统事件日志的传感器类型;将所述系统事件日志发送到所述基板管理控制器,以使得所述基板管理控制器记录所述初始化失败信息。
即,在第二启动阶段,可以从数据结构中将初始化信息读取出来,并发送到预设显示窗口显示。以及通过系统事件日志作为载体,将初始化识别信息发送到BMC记录保存。
本申请实施例通过在BIOS的第一启动阶段(PEI阶段)将初始化信息从CPU扫描出,并保存在BIOS的预设内存中的目标数据结构中,使得初始化失败信息保存到BIOS的第二启动阶段,进而使得初始化失败信息得到显示并记录。
在一个可选实施例中,在第一启动阶段,还可以通过类似ACPI(AdvancedConfiguration and Power Interface)表的形式对初始化失败信息进行保存。具体的,该类ACPI表的每一行记载有一条初始化失败信息,所述类ACPI表的每一列用于记载初始化失败信息中具体包括的信息类别,如第一列记载目标引脚所在的中央处理器信息、第二列记载物理层微型控制单元对应的内存槽位信息、第三列记载述物理层微型控制单元的错误类型信息等。所述类ACPI表保存在BIOS预设内存中,BIOS通过预设内存地址访问类ACPI表。
进而在本申请可选实施例中,在采用类ACPI表这种保存方式的情况下,可以在第二启动阶段根据类ACPI表直接发送所有初始化失败信息到预设显示窗口上显示,以及将所有初始化信息记载到系统事件日志中,一次性的发送到BMC中。
需要说明的是,ACPI是一种电源管理和配置接口标准,定义了一系列数据结构和表格,用于描述系统硬件配置、电源管理状态等信息。通过在ACPI表中保存信息,可以在下一阶段的BIOS启动中访问和使用这些信息。
在一个示例性实施例中,将所述初始化失败信息发送到基板管理控制器进行记录之后,所述方法还包括:确定所述目标数据结构中保存的所有所述初始化失败信息的数量M,其中,M为正整数;确定将所述初始化失败信息发送到基板管理控制器的发送次数N,其中,N为非负整数;确定M和N的大小关系;在所述大小关系指示M与N相等的情况下,将所有所述初始化失败信息对应的M个内存模块隔离,其中,所述M个内存模块中的每个内存模块都通过一个物理层微型控制单元与所述中央处理器通信。
可以理解的是,在确定所有所述初始化失败信息都发送到基板管理控制器之后,即可对相关内存模块进行隔离。本申请实施例通过上述数量确认操作保证了初始化失败信息完整且全部的发送到BMC进行记录,进而保证了供给技术人员进行debug分析的失败信息的信息完整性;以及通过对内存模块的隔离,隔离了初始化失败的内存模块可能对服务器造成的干扰,从而保证了服务器正常启动运行。
可选的,对中央处理器进行扫描之后,所述方法还包括:在未获取到所述初始化失败信息的情况下,确定所述物理层微型控制单元以及所述物理层微型控制单元所管理的内存模块初始化成功;按照预设训练方式对所述内存模块进行内存训练;在所述内存训练结束的情况下,测试所述内存模块的内存性能;在所述内存性能达到预设性能标准的情况下,确定所述中央处理器可以与所述内存模块进行的数据交互。
可以理解的是,对所有内存模块及其对应的PMU的初始化操作是同时进行的,进而根据电平状态变化可以及时区分出初始化失败以及成功的内存模块及其对应的PMU。从而在未获取到所述初始化失败信息的情况下,可以对初始化成功的内存模块进行后续启动操作,包括但不限于按照预设训练方式训练、测试内存模块的内存性能等。在后续启动操作结束后,即可确定中央处理器与内存模块的数据交互可以进行。
可选的,对中央处理器进行扫描之前,所述方法还包括:确定所述基板管理控制器的是否可以执行以下至少之一操作:登录操作、温度的获取操作、数量获取操作,其中,所述温度用于指示所述基本输入输出系统和所述基板管理控制器所在的服务器中的中央处理器温度或网卡温度,所述数量用于指示所述服务器中目标部件的数量;在所述基板管理控制器可以执行所述操作的情况下,确定所述基板管理控制器处于正常工作状态。
本申请实施例通过确定基板管理控制器处于正常工作状态,保证了BIOS在第二启动阶段可以通过IPMI接口将系统事件日志发送到BMC进行保存。从而保证了整个方案的正确实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
为了更好的理解上述失败信息的记录方法的过程,以下再结合可选实施例对上述失败信息的记录方法的实现流程进行说明,但不用于限定本申请实施例的技术方案。
相关技术中,DDR5的内存单片芯片密码超过16Gb,而DDR4主要以4Gb为主,这样DDR内存就有了更大的内存容量,DDR5的带宽速度可以稳定在4800MT/s,而DDR4最大在3200MT/s,带宽速度提升了1/3,对于数据的传输是非常有利的,同时DDR5内存相对于DDR4有更强的性能并且有更低的功耗,客户在使用过程中,可以在完成同样的工作量前提下消耗更少的电量,对于服务器这种高耗电产品而言,这对于客户节约使用成本是一个很大的亮点。但由于DDR5稳定性较差,在使用过程中的初始化阶段容易出现PMU初始化失败的情况。
针对PMU初始化失败的情况,相关技术中采用跑内存眼图测试的方式,通过CPU记录PMU初始化失败的错误。但这种记录方案存在如下问题:
1)只有在跑内存眼图测试的时候,CPU才会主动去记录初始化失败的内存PMU信息,内存眼图的测试需要使能BIOS和CPLD的特定功能,这就导致正常发布到客户使用的BIOS和CPLD是无法跑内存眼图测试的,导致内存PMU初始化失败的信息无法显示出来。
2)在跑内存眼图测试的时候,假如内存PMU初始化报了错,那么眼图测试就会主动停止,在眼图的测试日志中报出对应的从错误,非常不利于报错原始数据的保存、抓取和分析。
3)因内存眼图测试的PMU初始化数据不会记录在CPU寄存器中,那么机器在开机到post阶段,BIOS就无法轮询获取对应的信息,从而无法通过IPMI交互的方式将内存报错信息发送给BMC记录在BMC web上,不利于内存问题的debug分析。
针对上述问题,本申请可选实施例需要实现如下目的:在BMC正常工作的前提下实现内存PMU初始化失败日志的记录,具体地:1)在编译BIOS版本的时候不需要修改内存眼图测试相关的功能;2)将触发PMU初始化失败的内存隔离,其余内存接在机器上开机;3)可以查看到post处有PMU初始化的报错信息和BMC web上的报错sel日志。
可选的,本申请可选实施例实现方案如图3、图4、和图5所示,其中,图3示出了步骤S301至步骤S304;图4示出了步骤S3041之后,应当执行的步骤S305至步骤S309;图5示出了步骤S3042之后,应当执行的步骤S310至步骤S312。
图3、图4、和图5所示的步骤具体如下:
步骤S301:机器刷上BIOS正常开机。
在机器上刷上正常发布的BIOS文件(即将服务器的BIOS固件更新为最新版本),然后开机。
在该方案的实现过程中,需要BMC是正常工作状态,只有这样ipmi服务才是保持畅通的,BIOS和BMC之间才可以正常交互,PMU初始化失败的日志BIOS才可以正常发给BMC,BMC记录下来。
步骤S302:内存前期初始化。
当CPU检测到内存时,接着CPU会首先确认适配的DDR5内存的频率,并计算内存厂商适配的内存时序timing参数并配置到CPU通用内存控制器(Unit ManagementController,UMC)中,接着就开始CPU对内存的前期初始化。
步骤S303:内存PMU初始化。
内存的前期初始化之后,再PMU初始化。
步骤S304:判断初始化是否成功。步骤S304具体还包括步骤S3041和步骤S3042。步骤S3041:如果内存PMU初始化失败,则执行步骤S305;步骤S3042:如果内存PMU初始化成功,则执行步骤S310。
当CPU逐根对内存进行初始化发现有PMU初始化失败的内存时,就会触发CPU特定pin脚的电平变化,从而标志主板上PMU初始化失败的内存位置和详细失败信息。
步骤S305:PEI阶段创建HOB存储PMU初始化失败信息。
当PMU初始化失败情况发生后,BIOS开机在PEI阶段的时候,会初始化AmdErrorLogService服务,之后创建一个HOB,将初始化失败的内存信息存在HOB中,用于PEI阶段和DXE阶段信息的传递,在这个HOB信息中,会存储PMU初始化失败的内存的CPU、Chanel以及双列直插式内存模块(Dual lnline Memory Module,DIMM)和PMU的错误信息类型等信息。需要说明的是,DXE(Driver Execution Environment)是BIOS启动过程中的驱动执行环境。
步骤S306:Post阶段打印PMU初始化失败的内存信息。
接着在机器开机到Post阶段,将错误信息以字符串String的形式通过Video打印在Post屏幕上,让相应的开发人员和运维人员可以清晰的看到报错的内存具体信息。
步骤S307:Post阶段BIOS发送sel日志给BMC。
待机器开机到Post阶段的时候,BIOS也会将抓取到的内存PMU初始化失败的信息以事件的形式记录在SelRecord中,这个SelRecord中可以记录下时间戳、sel生成的ID、事件的版本、以及BMC系统中的接收事件的传感器Sensor类型、位数、PM U初始化失败时CPU反馈的数据等。需要BIOS和BMC共同制定一下sel日志的生成形式来实现BIOS的准确发送和BMC的精准解析。
步骤S308:BMC将PMU初始化失败信息记录在BMC web上。
BMC解析完成后,会记录一条日志在BMC web上,以方便运维人员远程总结开机过程中的各种报错。
步骤S309:内存被隔离,无法正常使用。结束。
PMU初始化失败的内存将就会被隔离出来,不能做为正常的内存用于和CPU进行数据的交互,PMU初始化失败的内存将不会影响CPU对其余的正常内存进行初始化。
步骤S310:内存training。
步骤S311:内存性能测试。
步骤S312:内存开始正常和CPU交互数据。结束。
可选的,本申请可选实施例具体实施过程中的部分源码设计如下:
1.BIOS下扫描内存PMU初始化失败信息的函数入口如下:
/*********************************************************************************
*Name:AmdErrorLogDisplayRsDxelnit
*
*Description
*Entry point of the AM D Error Log DXE driVer
*Perform the configuration init,resource reserVation,early post init
*and install all the supported protocol
*
*lnput
*lmageHandle:EFl lmage Handle for the DXE driVer
*SystemTable:pointer t0 the EFI system table
*
*Output
*EFI_SUCCESS:Module initialized successfully
*EFI_ERROR:lnitialization fa.led(see error for more details)
*
*********************************************************************************/
EFI_STATUS
EFIAPI
AmdErrorLogDisplayRsDxelnit(
IN EFI_HANDLE lmageHandle,
IN EFI_SYSTEM_TABLE*SystemTable
)
2.BIOS在PEI创建HOB用来存储PMU初始化失败的详细信息,来实现PEI阶段和DXE阶段的数据传递:
VOID
DisplayMemPmuTrainingFailure(
)
3.在post阶段打印PMU初始化失败的信息在post Video界面:
/*---------------------------------------------------------------------------------------*/
/**
*This function aquires gAmdErrorLogServiceProtocolGuid and displayany error of
*ABL_MEM_PMU_TRAIN_ERROR&ABL_MEM_AGESA_MEMORY_TEST_ERROR to serialconsole&video
*screen
*
*/
VOID
DisplayAmdErrorLogCallBackRs(
IN EFI_EVENT Event,
IN VOID*Context
)
4.PMU初始化失败的部分信息会存在如下的字符串中,已提供PMU初始化失败时进行错误调用:
STATIC CONST PMU_ERRORCODE_STRING PmuString[]={
//String file of APPB_RS_9048_23_5_3_17_38_45.7z
//Following message from ddr5_rdimm_pmu_train.strings
{0x000f0000,L″PMU:Error:start address of ACSM MPR read sequence mustbe aligned on even acsm addr position\n″},
{0x00220001,L″PMU:Error:CS%d failed to find a DFIMRL setting thatworked for all bytes during MaxRdLat training\n″},
};
5.BIOS发送PMU初始化失败的sel信息给BMC,BMC解析后记录在BMC web上,代码如下:
基于上述内容,本申请可选实施例对现有的内存PMU初始化失败的提示信息进行了优化,借助了外部BMC功能更加准确详细的记录了内存PMU初始化失败的信息。进而本申请实施例可以在每次内存初始化后,将内存PMU初始化失败的信息记录在Post video界面,这样可以让研发人员实时发现内存PMU初始化失败的情况,方便内存相关的问题debug验证;此外,内存PMU初始化失败后的信息可以记录在BMC web上,通过BMC一键日志中的sel日志可以实现永久记录机器运行异常信息,方便客户机房机器的问题排查和解决;本申请可选实施例同时也避免了内存眼图的多次测试,在往常的项目中,会花费大量的时间来进行内存眼图测试排查内存PMU初始化失败的概率,从而判断内存在服务器上使用的稳定性,而本申请可选实施例在Genoa平台上可以实现内存PMU初始化的验证和其余功能验证的同时进行,节约了大量的时间。
本申请可选实施例在不依赖内存眼图测试前提下实现内存PMU初始化失败信息在Post Video上的显示和BMCweb上的sel显示,极大的降低了服务器研发人员的debug难度,实现了内存PMU初始化信息的实时显示和永久记录,对于服务器整机的开发和运维均是一个极大地提升。
在本实施例中还提供了一种失败信息的记录装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语″模块″可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本申请实施例的失败信息的记录装置的结构框图,如图6所示,该装置包括:
扫描模块62,用于在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;
保存模块64,用于将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;
发送模块66,用于在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
通过上述装置,在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。因此,可以解决现有技术中,PMU初始化失败信息的记录依赖内存眼图测试,无法在开机post阶段显示并记录的问题。使得PMU的初始化失败信息能够保存到第二启动阶段,进而达到对初始化失败信息进行显示和记录的技术效果。
在一个示例性实施例中,扫描模块62,还用于确定所述中央处理器的目标引脚的电平状态变化,其中,所述目标引脚是所述物理层微型控制单元连接到所述中央处理器的引脚;在所述电平状态变化指示所述目标引脚的电平从高电平状态变为低电平状态的情况下,通过目标函数扫描所述目标引脚的相关信息,并将所述相关信息确定为所述初始化失败信息,其中,所述相关信息至少包括:所述目标引脚所在的中央处理器信息、所述物理层微型控制单元对应的内存槽位信息、所述物理层微型控制单元的错误类型信息。
在一个示例性实施例中,保存模块64,还用于为所述初始化失败信息分配标识信息,并将所述标识信息和所述初始化失败信息打包成数据块,其中,所述标识信息用于在存在多个初始化失败信息的情况下,标识所述初始化失败信息对应的所述数据块;确定所述目标数据结构在所述预设内存中的地址信息;根据所述地址信息将所述数据块保存到所述目标数据结构中。
在一个示例性实施例中,发送模块66,还用于按照所述标识信息和所述地址信息从所述目标数据结构中获取所述初始化失败信息;将所述初始化失败信息记录到系统事件日志中,其中,所述系统事件日志是通过所述基本输入输出系统和所述基板管理控制器共同进行日志形式定制的日志,所述系统事件日志至少还记载有以下信息:所述系统事件日志的日志标识、所述初始化失败信息的信息版本、所述基板管理控制器接收所述系统事件日志的传感器类型;将所述系统事件日志发送到所述基板管理控制器,以使得所述基板管理控制器记录所述初始化失败信息。
在一个示例性实施例中,所述装置还包括隔离模块,用于确定所述目标数据结构中保存的所有所述初始化失败信息的数量M,其中,M为正整数;确定将所述初始化失败信息发送到基板管理控制器的发送次数N,其中,N为非负整数;确定M和N的大小关系;在所述大小关系指示M与N相等的情况下,将所有所述初始化失败信息对应的M个内存模块隔离,其中,所述M个内存模块中的每个内存模块都通过一个物理层微型控制单元与所述中央处理器通信。
在一个示例性实施例中,所述装置还包括第一确定模块,用于在未获取到所述初始化失败信息的情况下,确定所述物理层微型控制单元以及所述物理层微型控制单元所管理的内存模块初始化成功;按照预设训练方式对所述内存模块进行内存训练;在所述内存训练结束的情况下,测试所述内存模块的内存性能;在所述内存性能达到预设性能标准的情况下,确定所述中央处理器可以与所述内存模块进行的数据交互。
在一个示例性实施例中,所述装置还包括第二确定模块,用于确定所述基板管理控制器的是否可以执行以下至少之一操作:登录操作、温度的获取操作、数量获取操作,其中,所述温度用于指示所述基本输入输出系统和所述基板管理控制器所在的服务器中的中央处理器温度或网卡温度,所述数量用于指示所述服务器中目标部件的数量;在所述基板管理控制器可以执行所述操作的情况下,确定所述基板管理控制器处于正常工作状态。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种失败信息的记录方法,其特征在于,包括:
在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;
将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;
在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
2.根据权利要求1所述的方法,其特征在于,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,包括:
确定所述中央处理器的目标引脚的电平状态变化,其中,所述目标引脚是所述物理层微型控制单元连接到所述中央处理器的引脚;
在所述电平状态变化指示所述目标引脚的电平从高电平状态变为低电平状态的情况下,通过目标函数扫描所述目标引脚的相关信息,并将所述相关信息确定为所述初始化失败信息,其中,所述相关信息至少包括:所述目标引脚所在的中央处理器信息、所述物理层微型控制单元对应的内存槽位信息、所述物理层微型控制单元的错误类型信息。
3.根据权利要求1所述的方法,其特征在于,将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构,包括:
为所述初始化失败信息分配标识信息,并将所述标识信息和所述初始化失败信息打包成数据块,其中,所述标识信息用于在存在多个初始化失败信息的情况下,标识所述初始化失败信息对应的所述数据块;
确定所述目标数据结构在所述预设内存中的地址信息;
根据所述地址信息将所述数据块保存到所述目标数据结构中。
4.根据权利要求3所述的方法,其特征在于,将所述初始化失败信息发送到基板管理控制器进行记录,包括:
按照所述标识信息和所述地址信息从所述目标数据结构中获取所述初始化失败信息;
将所述初始化失败信息记录到系统事件日志中,其中,所述系统事件日志是通过所述基本输入输出系统和所述基板管理控制器共同进行日志形式定制的日志,所述系统事件日志至少还记载有以下信息:所述系统事件日志的日志标识、所述初始化失败信息的信息版本、所述基板管理控制器接收所述系统事件日志的传感器类型;
将所述系统事件日志发送到所述基板管理控制器,以使得所述基板管理控制器记录所述初始化失败信息。
5.根据权利要求1所述的方法,其特征在于,将所述初始化失败信息发送到基板管理控制器进行记录之后,所述方法还包括:
确定所述目标数据结构中保存的所有所述初始化失败信息的数量M,其中,M为正整数;
确定将所述初始化失败信息发送到基板管理控制器的发送次数N,其中,N为非负整数;
确定M和N的大小关系;
在所述大小关系指示M与N相等的情况下,将所有所述初始化失败信息对应的M个内存模块隔离,其中,所述M个内存模块中的每个内存模块都通过一个物理层微型控制单元与所述中央处理器通信。
6.根据权利要求1所述的方法,其特征在于,对中央处理器进行扫描之后,所述方法还包括:
在未获取到所述初始化失败信息的情况下,确定所述物理层微型控制单元以及所述物理层微型控制单元所管理的内存模块初始化成功;
按照预设训练方式对所述内存模块进行内存训练;
在所述内存训练结束的情况下,测试所述内存模块的内存性能;
在所述内存性能达到预设性能标准的情况下,确定所述中央处理器可以与所述内存模块进行的数据交互。
7.根据权利要求1所述的方法,其特征在于,对中央处理器进行扫描之前,所述方法还包括:
确定所述基板管理控制器的是否可以执行以下至少之一操作:登录操作、温度的获取操作、数量获取操作,其中,所述温度用于指示所述基本输入输出系统和所述基板管理控制器所在的服务器中的中央处理器温度或网卡温度,所述数量用于指示所述服务器中目标部件的数量;
在所述基板管理控制器可以执行所述操作的情况下,确定所述基板管理控制器处于正常工作状态。
8.一种失败信息的记录装置,其特征在于,包括:
扫描模块,用于在基本输入输出系统的第一启动阶段,对中央处理器进行扫描,以获取与中央处理器连接的物理层微型控制单元的初始化失败信息,其中,所述物理层微型控制单元用于对服务器的内存模块进行管理;
保存模块,用于将所述初始化失败信息保存至所述基本输入输出系统的预设内存中预先创建的目标数据结构;
发送模块,用于在所述基本输入输出系统的第二启动阶段,将所述初始化失败信息发送到预设显示窗口上进行显示,以及将所述初始化失败信息发送到基板管理控制器进行记录。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法的步骤。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至7任一项中所述的方法的步骤。
CN202311459801.XA 2023-11-03 2023-11-03 失败信息的记录方法和装置、存储介质及电子装置 Pending CN117421189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311459801.XA CN117421189A (zh) 2023-11-03 2023-11-03 失败信息的记录方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311459801.XA CN117421189A (zh) 2023-11-03 2023-11-03 失败信息的记录方法和装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN117421189A true CN117421189A (zh) 2024-01-19

Family

ID=89529937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311459801.XA Pending CN117421189A (zh) 2023-11-03 2023-11-03 失败信息的记录方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN117421189A (zh)

Similar Documents

Publication Publication Date Title
US20070055793A1 (en) System of managing peripheral interfaces in IPMI architecture and method thereof
CN103827834B (zh) 一种内存数据的迁移方法、计算机和装置
CN101373448B (zh) 具有远程管理的计算机系统
CN110162435B (zh) 一种服务器pxe启动测试方法、系统、终端及存储介质
TWI261748B (en) Policy-based response to system errors occurring during OS runtime
CN116541227B (zh) 故障诊断方法、装置、存储介质、电子装置及bmc芯片
CN110580235A (zh) 一种sas扩展器通信方法及装置
US7124412B2 (en) Extensible BIOS error log
US10691569B2 (en) System and method for testing a data storage device
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
CN116627472A (zh) 高速外围组件设备的固件程序升级方法及服务器
CN117421189A (zh) 失败信息的记录方法和装置、存储介质及电子装置
CN115454896A (zh) 基于smbus的ssd mctp控制消息验证方法、装置、计算机设备及存储介质
CN111061603B (zh) 可记录自检数据的主板和计算机、自检数据的记录方法
CN112579507A (zh) 宿主机与bmc通信的方法、bios、操作系统、bmc和服务器
CN111694587A (zh) 服务器pnor固件升级方法、装置、设备及存储介质
CN105353980A (zh) 一种内存数据的迁移方法、计算机和装置
CN117311769B (zh) 服务器日志生成方法和装置、存储介质及电子设备
CN102455970B (zh) 带可靠性检测功能的多外设boot实现方法、设备及系统
CN117493065B (zh) 处理器信息的处理方法和装置,存储介质及电子设备
CN114613418B (zh) 对固态硬盘的NVMe-MI功能测试的系统及方法
CN117555760B (zh) 服务器监测方法及装置、基板控制器及嵌入式系统
CN115629825B (zh) 一种服务器及其资产信息获取方法、提供方法和装置
CN117215859B (zh) 主备bios自动切换方法、自动切换装置和计算机
US6915460B2 (en) Method, apparatus, and program for service processor surveillance with multiple partitions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination