CN114201360B - 一种aer功能管理方法、装置、服务器和存储介质 - Google Patents

一种aer功能管理方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN114201360B
CN114201360B CN202111420456.XA CN202111420456A CN114201360B CN 114201360 B CN114201360 B CN 114201360B CN 202111420456 A CN202111420456 A CN 202111420456A CN 114201360 B CN114201360 B CN 114201360B
Authority
CN
China
Prior art keywords
aer
aer function
function management
function
pcie
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111420456.XA
Other languages
English (en)
Other versions
CN114201360A (zh
Inventor
梁志强
管彦广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111420456.XA priority Critical patent/CN114201360B/zh
Publication of CN114201360A publication Critical patent/CN114201360A/zh
Application granted granted Critical
Publication of CN114201360B publication Critical patent/CN114201360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3027Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Abstract

本申请公开了一种AER功能管理方法、装置、服务器和存储介质,涉及服务器技术领域。AER功能管理方法,应用于基本输入输出系统BIOS,所述方法包括:遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭。本申请能够通过AER功能管理开关实现AER功能打开或关闭,让AER错误上报功能的验证变得简单灵活,同时还可以在后续定位问题时,保持版本的一致性,减少维护成本。

Description

一种AER功能管理方法、装置、服务器和存储介质
技术领域
本申请涉及服务器技术领域,具体涉及一种AER功能管理方法、装置、服务器和存储介质。
背景技术
PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,PCIE属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。
服务器通常通过PCIE设备扩展外接功能,以增强服务器的性能。其中,PCIE设备为通过根端口插接在服务器的处理器上的硬件设备。示例地,PCIE设备可以包括:网卡、图形处理器(Graphics Processing Unit,GPU)和现场可编程逻辑门阵列(Field ProgrammableGateArray,FPGA)芯片等。
而高级错误报告AER(Advanced Error Reporting)功能是PCIE规范的基本功能,我们开发的存储系统必须要保证这个功能是正常的。
在系统正常工作的过程,为保证对客户的友好性及系统的稳定性,一般需要把PCIE设备的AER错误上报功能给屏蔽掉,比如在热插拔卡的时候,将不会看到系统中因热插拔卡而导致的AER错误处理日志信息。
当系统出现功能异常时,打开AER功能来确认问题的来源也是调试系统的一种手段。因此在前期开发中系统中所有PCIE链路的AER错误上报功能是必须要验证的。
目前验证AER错误上报功能的方法,一般是通过BIOS的临时版本,在临时版本里,把所有相关的基础都按规范配置,这样在热插拔卡,热插拔盘时就会触发AER错误信号的产生。或者是保持BIOS的配置不变,在系统下通过shell脚本配置PCIE配置空间的寄存器,这样通过手动执行脚本,然后再通过热插拔卡或盘的方式触发AER错误信号。
但是这样的方式存在以下缺陷:
1、通过配置临时版本的方式不够灵活,虽然在前期调试时能满足测试的需求,但若后期需要借助AER功能来协助定位问题时,还需要再重新发布临时版本,不仅繁琐、浪费时间,同时重新发布的临时版本与历史的版本不能保持版本的一致性;
2、通过脚本的方式来验证,要覆盖到系统中所有的PCIE设备,就必须配置全部的寄存器,这样需要配置的寄存器将会非常多,配置过程中容易出错,且维护工作量大,维护成本高。
发明内容
为了解决上述背景技术中提到的至少一个问题,本申请提供了一种AER功能管理方法、装置、服务器和存储介质,能够通过AER功能管理开关实现AER功能打开或关闭,让AER错误上报功能的验证变得简单灵活,同时还可以在后续定位问题时,保持版本的一致性,减少维护成本。
本申请实施例提供的具体技术方案如下:
第一方面,提供一种AER功能管理方法,应用于基本输入输出系统BIOS,所述方法包括:
遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;
创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭。
进一步的,所述遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息,还包括:
获取所述PCIE链路下的所有PCIE设备的设备信息;
所述设备信息包括所述PCIE设备的标识号,所述标识号可以是所述PCIE设备的BDF号。
进一步的,所述AER功能管理开关还配置于所述BIOS的设置界面中;
所述AER功能管理开关还用于传递参数值,所述参数值包括0或1。
进一步的,所述创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭,还包括:
所述BIOS根据所述参数值变更所述AER功能管理开关的开启状态;
若所述参数值为0,所述AER功能管理开关的开启状态为关闭状态,所述AER功能关闭;
若所述参数值为1,所述AER功能管理开关的开启状态为打开状态,所述AER功能打开。
进一步的,所述方法还包括:
对每条所述PCIE链路设置链路编号,根据所述链路编号打印对应的所述PCIE链路上所有AER功能相关的寄存器的值;
将所述链路编号写入带电可擦可编程只读存储器中,以供所述BIOS读取所述链路编号;
将所述寄存器的值存储至日志文件中,所述日志文件用于后续的调试和检查。
进一步的,所述方法还包括:
创建AER功能设备管理模块,所述AER功能设备管理模块用于获取需要修改AER功能的PCIE设备的修改信息,所述修改信息包括所述需要修改AER功能的PCIE设备的BDF号以及设备数量;
所述BDF号用于区分所述PCIE设备;
所述BDF号的数量与所述设备数量相等;
所述AER功能设备管理模块还用于根据所述修改信息修改对应的PCIE设备,以使需要修改AER功能的所述PCIE设备的AER功能打开或关闭。
进一步的,所述方法还包括:
将所述PCIE设备的修改信息以及所述PCIE设备的AER功能开启状态存入带电可擦可编程只读存储器中;
响应于所述BIOS重新启动,所述BIOS读取所述带电可擦可编程只读存储器,根据所述修改信息以及所述AER功能开启状态,配置所述PCIE设备的所有AER功能相关的寄存器。
第二方面,提供一种AER功能管理装置,包括:
获取模块,用于遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;
管理模块,用于创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭。
第三方面,提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述AER功能管理方法。
第四方面,提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行所述AER功能管理方法。
本申请实施例具有如下有益效果:
本申请实施例提供的一种AER功能管理方法、装置、服务器和存储介质,能够通过AER功能管理开关实现AER功能打开或关闭,让AER错误上报功能的验证变得简单灵活;能够根据链路编号打印对应的PCIE链路上所有AER功能相关的寄存器的值,通过日志文件检查定位问题,能够保持版本的一致性;还可以根据PCIE设备的BDF号、设备数量修改对应的AER功能,在发生因AER寄存器配置失误导致的AER中断不能正常触发的情况时,可以不用修改BIOS,通过AER功能管理应用程序就可以进行修改,通过系统重启即可完成操作,非常方便。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本申请实施例提供的AER功能管理方法的总流程图;
图2示出根据本申请一个实施例的AER功能管理方法的具体流程图;
图3示出本申请实施例提供的AER功能管理装置的结构示意图;
图4示出可被用于实施本申请中所述的各个实施例的示例性系统。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应当理解,在本申请的描述中,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
通常由服务器中的基本输入输出系统(Basic Input/Output System,BIOS)对PCIE设备进行管理。示例地,在服务器的运行过程中,当某一PCIE设备出现错误时,BIOS会判断该PCIE设备的错误是否为不可修正致命错误。当确定该错误为不可修正致命错误时,BIOS会触发处理器控制整个服务器重启,以对该PCIE设备进行初始化,从而修复该PCIE设备的错误。
实施例一
本申请提供了一种AER功能管理方法,应用于基本输入输出系统BIOS,参照图1,方法包括:
S1、遍历至少一条PCIE链路,获取PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息。
在一些实施例中,S1还包括:
S11、获取PCIE链路下的所有PCIE设备的设备信息。
其中,设备信息包括PCIE设备的标识号,标识号可以是PCIE设备的BDF号。
具体的,服务器中存在一条或者多条的PCIE链路,PCIE链路下挂一个或者多个PCIE设备。PCIE总线中的每一个功能都有一个唯一的标识号与之对应,这个标识号就是BDF(Bus,Device,Function)号。其中,BUS是总线号,最多可以通过配置软件分配256个总线号。每个P2P网桥创建一个新的总线,附加的PCIE设备可以连接到该总线。每个总线必须被分配一个唯一的总线号。配置软件通过搜索从总线0、设备0、功能0开始的桥,开始分配总线号,当发现网桥时,软件会给新总线分配一个唯一且大于网桥所在总线号的总线号。一旦新总线被分配了一个总线号,软件就开始在继续扫描当前总线上的更多的桥之前寻找新总线上的桥。Device是设备号,PCIE允许在单个PCI总线上挂最多32个设备号,PCIE的点对点特性意味着只有单个设备可以直接连接到PCIE链路,并且该设备总是以device 0结束。RC和Switch有虚拟PCI总线,它允许多个设备“连接”到总线上。每个设备必须实现Function 0,并且可能包含多达8个Function的集合。当包含两个或多个Function时,设备称为多功能设备。Function是功能号,如前述,功能被包含到每个Device中。需要注意的是,不管某一个PCIE设备拥有多少个功能,其每一个功能都有一个唯一独立的配置空间(ConfigurationSpace)与之对应。
具体的,PCIE总线采用的是一种深度优先(Depth First Search)的拓扑算法,且Bus0总是分配给Root Complex。Root中包含有集成的Endpoint和多个端口(Port),每个端口内部都有一个虚拟的PCI-to-PCI桥(P2P),并且这个桥也应有设备号和功能号。需要注意的是,每个设备必须要有功能0(Fun0),其他的7个功能(Fun1~Fun7)都是可选的。当软件检测多功能设备时,必须检查每一个可能的功能,以了解哪些功能是存在的。每个Function也有自己的配置地址空间,用于设置关联的资源。高级错误报告AER(Advanced ErrorReporting)功能是PCIE规范的基本功能,对应也有配置空间,配置空间里有寄存器。
S2、创建AER功能管理开关,AER功能管理开关用于变更配置信息以使AER功能打开或关闭。
其中,AER功能管理开关还配置于BIOS的设置界面中;AER功能管理开关还用于传递参数值,参数值包括0或1。
具体的,AER功能管理开关可以部署为BIOS的setup界面下的一个选项,可以在需要验证高级错误报告AER功能时,在BIOS的setup界面打开这个开关。
在一些实施例中,S2还包括:
S21、BIOS根据参数值变更AER功能管理开关的开启状态。
其中,若参数值为0,AER功能管理开关的开启状态为关闭状态,AER功能关闭;若参数值为1,AER功能管理开关的开启状态为打开状态,AER功能打开。
具体的,可以在操作系统中创建AER功能管理应用程序,AER功能管理应用程序可以用于打开或关闭AER功能。在进行调试AER功能时,能够通过该AER功能管理应用程序app,选择打开或关闭AER功能。根据选择打开或关闭AER功能与否,会生成对应的参数值,该参数值将被写入到带电可擦可编程只读存储器(Electrically Erasable Programmable readonly memory,eeprom)中。然后通过reboot命令让系统重启,BIOS响应于重新启动,读取带电可擦可编程只读存储器eeprom里的值,通过AER功能管理开关传递参数值,完成对应的打开或关闭AER功能操作。
在一些实施例中,参照图2,方法还包括:
S31、对每条PCIE链路设置链路编号,根据链路编号打印对应的PCIE链路上所有AER功能相关的寄存器的值;
S32、将链路编号写入带电可擦可编程只读存储器中,以供BIOS读取链路编号;
S33、将寄存器的值存储至日志文件中,日志文件用于后续的调试和检查。
具体的,BIOS里代码对每条PCIE链路编号,并设计一个打印每条链路上所有AER功能相关的寄存器的值的功能模块,把PCIE链路的链路编号作为模块的入参。初始默认设置为-1,将不会打印任何链路上AER功能相关的寄存器的值。示例性的,可以将这个模块作为AER功能管理开关下的子模块,PCIE链路的链路编号也可以作为BIOS的setup界面下的一个选项。
示例性的,上述的AER功能管理应用程序还用于配置PCIE链路的链路编号。当调试过程中发现某条PCIE链路的AER功能不通时,可通过上述配置的AER功能管理应用程序设置相应PCIE链路的链路编号。通过reboot命令重启系统,BIOS响应于重新启动,读取带电可擦可编程只读存储器eeprom里的值,其中存储了上述设置的链路编号。BIOS会根据配置的链路编号,打印对应链路上的所有PCIE设备的AER功能相关的寄存器的值到日志文件中。而通过检查日志文件,可以检查到这些寄存器的值,将很容易定位到是哪一个PCIE设备或是哪一些PCIE设备的配置有误导致的问题。
在一些实施例中,方法还包括:
S41、创建AER功能设备管理模块。AER功能设备管理模块用于获取需要修改AER功能的PCIE设备的修改信息。
其中,修改信息包括需要修改AER功能的PCIE设备的BDF号以及设备数量。BDF号用于区分PCIE设备,BDF号的数量与设备数量相等。AER功能设备管理模块还用于根据修改信息修改对应的PCIE设备,以使需要修改AER功能的PCIE设备的AER功能打开或关闭。
具体的,可以在BIOS中添加AER功能设备管理模块。改AER功能设备管理模块可以用来修改PCIE链路上每一个PCIE设备的AER功能相关的寄存器,来打开和关闭这个PCIE设备的AER错误上报功能。因此,就可以将PCIE设备的BDF号、需要修改AER功能的PCIE设备的设备数量作为AER功能设备管理模块的输入参数。示例性的,也可以将修改功能作为BIOSsetup界面下的一个选项,默认是关闭状态。将AER功能设备管理模块开启后,可以显示PCIE设备的BDF号、AER功能的打开或关闭状态(即开启状态)。
在一些实施例中,方法还包括:
S42、将PCIE设备的修改信息以及PCIE设备的AER功能开启状态存入带电可擦可编程只读存储器中。
S43、响应于BIOS重新启动,BIOS读取带电可擦可编程只读存储器,根据修改信息以及AER功能开启状态,配置PCIE设备的所有AER功能相关的寄存器。
具体的,可以将AER功能相关的setup配置复制一份到带电可擦可编程只读存储器eeprom里,修改BIOS代码的相关逻辑,让其启动时优先去eeprom里获取AER功能相关的配置信息。
示例性的,上述的AER功能管理应用程序还用于管理AER功能设备管理模块。当调试过程中发现存在PCIE设备的AER配置有误,可通过AER功能管理应用程序设置PCIE设备的BDF号、设备数量、AER功能开启状态。这些配置值将写入带电可擦可编程只读存储器eeprom中。同样的,通过reboot命令重启系统,BIOS在启动过程中读取eeprom里的值,AER功能设备管理模块将根据BDF号通过AER功能管理开关去设置对应的PCIE设备的所有AER功能相关的寄存器。因为这些寄存器是符合PCIE规范的,所以能够对所有涉及的PCIE设备做统一处理,只需要通过BDF号进行区分不同的PCIE设备即可。
在本实施例中,能够通过AER功能管理开关实现AER功能打开或关闭,让AER错误上报功能的验证变得简单灵活;能够根据链路编号打印对应的PCIE链路上所有AER功能相关的寄存器的值,通过日志文件检查定位问题,能够保持版本的一致性;还可以根据PCIE设备的BDF号、设备数量修改对应的AER功能,在发生因AER寄存器配置失误导致的AER中断不能正常触发的情况时,可以不用修改BIOS,通过AER功能管理应用程序就可以进行修改,通过系统重启即可完成操作,非常方便。
实施例二
对应上述实施例,本申请还提供了一种AER功能管理装置,参照图3,包括:获取模块和管理模块。其中,获取模块,用于遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;管理模块,用于创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭。
进一步的,获取模块还用于获取所述PCIE链路下的所有PCIE设备的设备信息。其中,所述设备信息包括所述PCIE设备的标识号,所述标识号可以是所述PCIE设备的BDF号。
进一步的,所述AER功能管理开关还配置于所述BIOS的设置界面中;所述AER功能管理开关还用于传递参数值,所述参数值包括0或1。
进一步的,管理模块还用于根据所述参数值变更所述AER功能管理开关的开启状态。其中,若所述参数值为0,所述AER功能管理开关的开启状态为关闭状态,所述AER功能关闭;若所述参数值为1,所述AER功能管理开关的开启状态为打开状态,所述AER功能打开。
进一步的,AER功能管理装置还包括打印模块,用于对每条所述PCIE链路设置链路编号,根据所述链路编号打印对应的所述PCIE链路上所有AER功能相关的寄存器的值;以及用于将所述链路编号写入带电可擦可编程只读存储器中,以供所述BIOS读取所述链路编号;还用于将所述寄存器的值存储至日志文件中,所述日志文件用于后续的调试和检查。
进一步的,AER功能管理装置还包括控制模块,用于创建AER功能设备管理模块。其中,所述AER功能设备管理模块用于获取需要修改AER功能的PCIE设备的修改信息,所述修改信息包括所述需要修改AER功能的PCIE设备的BDF号以及设备数量。所述BDF号用于区分所述PCIE设备;所述BDF号的数量与所述设备数量相等;所述AER功能设备管理模块还用于根据所述修改信息修改对应的PCIE设备,以使需要修改AER功能的所述PCIE设备的AER功能打开或关闭。
进一步的,控制模块还用于将所述PCIE设备的修改信息以及所述PCIE设备的AER功能开启状态存入带电可擦可编程只读存储器中;以及用于响应于所述BIOS重新启动,读取所述带电可擦可编程只读存储器,根据所述修改信息以及所述AER功能开启状态,配置所述PCIE设备的所有AER功能相关的寄存器。
实施例三
对应上述实施例,本申请还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时可以实现上述AER功能管理方法。
如图4所示,在一些实施例中,系统能够作为各所述实施例中的任意一个用于AER功能管理方法的上述服务器。在一些实施例中,系统可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器)。
对于一个实施例,系统控制模块可包括任意适当的接口控制器,以向(一个或多个)处理器中的至少一个和/或与系统控制模块通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块可包括存储器控制器模块,以向系统存储器提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
系统存储器可被用于例如为系统加载和存储数据和/或指令。对于一个实施例,系统存储器可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备及(一个或多个)通信接口提供接口。
例如,NVM/存储设备可被用于存储数据和/或指令。NVM/存储设备可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备可包括在物理上作为系统被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备可通过网络经由(一个或多个)通信接口进行访问。
(一个或多个)通信接口可为系统提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
实施例四
对应上述实施例,本申请还提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行AER功能管理方法。
在本实施例中,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(RAM,DRAM,SRAM);以及非易失性存储器,诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种AER功能管理方法,应用于基本输入输出系统BIOS,其特征在于,所述方法包括:
遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;
创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭;
所述AER功能管理开关配置于BIOS的设置界面中,部署为BIOS的设置界面下的一个选项;AER功能管理开关用于传递参数值,参数值包括0或1;
所述BIOS根据参数值变更AER功能管理开关的开启状态,当参数值为0时,AER功能管理开关的开启状态为关闭状态,AER功能关闭;当参数值为1时,AER功能管理开关的开启状态为打开状态,AER功能打开;
其中,在操作系统中创建AER功能管理应用程序,AER功能管理应用程序用于打开或关闭AER功能;根据选择打开或关闭AER功能的状态,生成对应的参数值,所述参数值被写入到带电可擦可编程只读存储器中;响应于接收到reboot命令,BIOS系统重新启动,读取带电可擦可编程只读存储器eeprom里包含的值,以对应的打开或关闭AER功能操作。
2.根据权利要求1所述的AER功能管理方法,其特征在于,所述遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息,还包括:
获取所述PCIE链路下的所有PCIE设备的设备信息;
所述设备信息包括所述PCIE设备的标识号,所述标识号可以是所述PCIE设备的BDF号。
3.根据权利要求1所述的AER功能管理方法,其特征在于,所述AER功能管理开关还配置于所述BIOS的设置界面中;
所述AER功能管理开关还用于传递参数值,所述参数值包括0或1。
4.根据权利要求3所述的AER功能管理方法,其特征在于,所述创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭,还包括:
所述BIOS根据所述参数值变更所述AER功能管理开关的开启状态;
若所述参数值为0,所述AER功能管理开关的开启状态为关闭状态,所述AER功能关闭;
若所述参数值为1,所述AER功能管理开关的开启状态为打开状态,所述AER功能打开。
5.根据权利要求1所述的AER功能管理方法,其特征在于,所述方法还包括:
对每条所述PCIE链路设置链路编号,根据所述链路编号打印对应的所述PCIE链路上所有AER功能相关的寄存器的值;
将所述链路编号写入带电可擦可编程只读存储器中,以供所述BIOS读取所述链路编号;
将所述寄存器的值存储至日志文件中,所述日志文件用于后续的调试和检查。
6.根据权利要求2所述的AER功能管理方法,其特征在于,所述方法还包括:
创建AER功能设备管理模块,所述AER功能设备管理模块用于获取需要修改AER功能的PCIE设备的修改信息,所述修改信息包括所述需要修改AER功能的PCIE设备的BDF号以及设备数量;
所述BDF号用于区分所述PCIE设备;
所述BDF号的数量与所述设备数量相等;
所述AER功能设备管理模块还用于根据所述修改信息修改对应的PCIE设备,以使需要修改AER功能的所述PCIE设备的AER功能打开或关闭。
7.根据权利要求6所述的AER功能管理方法,其特征在于,所述方法还包括:
将所述PCIE设备的修改信息以及所述PCIE设备的AER功能开启状态存入带电可擦可编程只读存储器中;
响应于所述BIOS重新启动,所述BIOS读取所述带电可擦可编程只读存储器,根据所述修改信息以及所述AER功能开启状态,配置所述PCIE设备的所有AER功能相关的寄存器。
8.一种AER功能管理装置,其特征在于,包括:
获取模块,用于遍历至少一条PCIE链路,获取所述PCIE链路上的高级错误报告AER功能相关的寄存器的配置信息;
管理模块,用于创建AER功能管理开关,所述AER功能管理开关用于变更所述配置信息以使AER功能打开或关闭;
所述AER功能管理开关配置于BIOS的设置界面中,部署为BIOS的设置界面下的一个选项;AER功能管理开关用于传递参数值,参数值包括0或1;
所述BIOS根据参数值变更AER功能管理开关的开启状态,当参数值为0时,AER功能管理开关的开启状态为关闭状态,AER功能关闭;当参数值为1时,AER功能管理开关的开启状态为打开状态,AER功能打开;
其中,在操作系统中创建AER功能管理应用程序,AER功能管理应用程序用于打开或关闭AER功能;根据选择打开或关闭AER功能的状态,生成对应的参数值,所述参数值被写入到带电可擦可编程只读存储器中;响应于接收到reboot命令,BIOS系统重新启动,读取带电可擦可编程只读存储器eeprom里包含的值,以对应的打开或关闭AER功能操作。
9.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~7中任意一项所述AER功能管理方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行权利要求1~7中任意一项所述AER功能管理方法。
CN202111420456.XA 2021-11-26 2021-11-26 一种aer功能管理方法、装置、服务器和存储介质 Active CN114201360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111420456.XA CN114201360B (zh) 2021-11-26 2021-11-26 一种aer功能管理方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111420456.XA CN114201360B (zh) 2021-11-26 2021-11-26 一种aer功能管理方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN114201360A CN114201360A (zh) 2022-03-18
CN114201360B true CN114201360B (zh) 2023-11-17

Family

ID=80649210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111420456.XA Active CN114201360B (zh) 2021-11-26 2021-11-26 一种aer功能管理方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN114201360B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117331723B (zh) * 2023-11-30 2024-02-27 苏州元脑智能科技有限公司 应用于arm服务器的arm安全固件配置方法及装置
CN117389819B (zh) * 2023-12-12 2024-03-01 苏州元脑智能科技有限公司 一种热插拔报错方法、处理器架构、设备以及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN110457164A (zh) * 2019-07-08 2019-11-15 华为技术有限公司 设备管理的方法、装置和服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO3121726T3 (zh) * 2014-06-24 2018-06-30

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN110457164A (zh) * 2019-07-08 2019-11-15 华为技术有限公司 设备管理的方法、装置和服务器

Also Published As

Publication number Publication date
CN114201360A (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
CN114201360B (zh) 一种aer功能管理方法、装置、服务器和存储介质
US10599599B2 (en) Selectable peripheral logic in programmable apparatus
US8386764B2 (en) BIOS architecture
US20120023318A1 (en) Providing platform independent memory logic
US10572434B2 (en) Intelligent certificate discovery in physical and virtualized networks
US10261880B1 (en) Error generation using a computer add-in card
CN109783340B (zh) SoC的测试代码烧写方法、IP测试方法及装置
US20160011879A1 (en) Preconfiguring hardware and speeding up server discovery prior to bios boot
JP2014532862A (ja) 構成可能なインターフェースを有する試験機器
CN113407393B (zh) 芯片验证方法、终端设备、验证平台以及存储介质
CN112825011A (zh) PCIe设备的上下电控制方法以及系统
CN114116378A (zh) 获取PCIe设备温度的方法、系统、终端及存储介质
CN110427326A (zh) 基于Driver Master的固态硬盘密码测试方法和装置
CN110704365A (zh) 一种基于fpga的重构装置
TWI785322B (zh) 用以測試包含處理單元與程式及/或資料記憶體之受測裝置的自動化測試設備、包含測試控制器、通向受測裝置的介面、共享記憶體之自動化測試設備和用以測試受測裝置之方法
CN113868051B (zh) 一种PCIe故障检测装置、方法、设备和存储介质
CN107908418B (zh) 光纤通道节点卡的逻辑程序升级方法及光纤通道总线设备
CN115562738B (zh) 一种端口配置方法、组件及硬盘扩展装置
KR20020082799A (ko) 동적 번인 테스트 기능을 갖는 단일칩 마이크로컴퓨터 및이를 위한 동적 번인 테스트 방법
CN116112412A (zh) 一种虚拟网卡绑定冗余功能测试方法、系统、装置及介质
CN116627472A (zh) 高速外围组件设备的固件程序升级方法及服务器
CN115729607A (zh) 一种设置界面命令格式同步方法、装置、设备和介质
CN113282439B (zh) eMMC测试方法、装置、可读存储介质及电子设备
CN115878327A (zh) 总线预留方法、装置、服务器、电子设备和存储介质
CN115080069A (zh) 基板管理控制器调试方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant