CN115878533A - Ai服务器的自适应配置方法、装置、设备和存储介质 - Google Patents

Ai服务器的自适应配置方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115878533A
CN115878533A CN202211697805.7A CN202211697805A CN115878533A CN 115878533 A CN115878533 A CN 115878533A CN 202211697805 A CN202211697805 A CN 202211697805A CN 115878533 A CN115878533 A CN 115878533A
Authority
CN
China
Prior art keywords
information
equipment
mcio
port
bios
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211697805.7A
Other languages
English (en)
Inventor
张盼
韩建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqin Technology Co Ltd
Original Assignee
Huaqin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqin Technology Co Ltd filed Critical Huaqin Technology Co Ltd
Priority to CN202211697805.7A priority Critical patent/CN115878533A/zh
Publication of CN115878533A publication Critical patent/CN115878533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Stored Programmes (AREA)

Abstract

本申请提供一种AI服务器的自适应配置方法、装置、设备和存储介质。该方法包括:CPLD收集MCIO连接设备的连接数据,将该数据写入寄存器;BIOS通过BMC获取每个MCIO端口连接的设备类型的ID,根据预先配置的设备类型ID与带宽信息之间的映射关系,对MCIO端口连接的设备进行带宽配置;在POST过程中枚举设备,得到设备的Physical ID和BDF信息,基于Physical ID以及预先配置的Physical ID对应的丝印信息关系数据表,获取Physical ID对应的丝印信息,并将该丝印信息和BDF信息写入SMBIOS结构表,完成自适应配置。通过本申请的方法,可以实现AI服务器设备的带宽和丝印信息自适应的配置,满足用户灵活的定制化配置需求。

Description

AI服务器的自适应配置方法、装置、设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种AI服务器的自适应配置方法、装置、设备和存储介质。
背景技术
随着大数据的发展,人工智能(Artificial Intelligence,简称:AI)服务器的需求急剧增多,AI服务器中会使用多个图形处理器(Graphics processing unit,简称:GPU)来支持大数据计算,再加上一些高速串行计算机扩展总线标准(Peripheral componentinterconnect express,简称:PCIE)网卡设备和硬盘,从而构成一个完整的AI服务器系统。
为了兼容和自适应各种场合,AI服务器需要支持多配置组合,AI服务器的PCIE设备一般通过内部电缆互连系统(Mini Cool Edge IO,简称:MCIO),来连接。软件通过现场可更换单元(Field Replace Unit,简称:FRU)类型(Identity document,简称:ID)来区分配置,软件通过给定的FRUID来设置固定的配置,从而达到多配置需求,满足设计和运维要求。这种方案需要软件维护一张配置表,如果有配置改动,需要去更新配置表,通过修改软件来支持系统配置。
但不同的用户需要的配置各不相同,需要灵活的定制化配置,如果用户的定制化配置不在软件维护的配置表中,就会导致服务器系统异常,导致业务无法运行。
发明内容
本申请实施例提供一种AI服务器的自适应配置方法、装置、设备和存储介质,用以解决AI服务器更换不在软件维护配置表中的设备后,带宽和丝印信息的需要人为手动配置的问题。
第一方面,本申请实施例提供一种AI服务器的自适应配置方法,应用于人工智能AI服务器主板,所述AI服务器主板包括复杂可编程逻辑器件CPLD,基板管理控制器BMC以及基本输入输出系统BIOS,所述方法包括:
在所述AI服务器主板上电后,通过CPLD收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
在所述BIOS启动后,所述BIOS通过所述BMC获取每个MCIO端口连接的设备类型的ID;
所述BIOS根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
所述BIOS在上电自检POST过程中枚举设备,得到每个设备的第一枚举信息,所述第一枚举信息中包括所述设备的物理地址Physical ID和标识符BDF信息;
基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个Physical ID对应的丝印信息。
结合第一方面,在一些实施例中,所述方法还包括:
在所述BIOS中的可扩展平台管理redfish模块启动过程中,收集每个设备的资产信息;
所述BIOS对设备进行枚举,得到第二枚举信息,并从SMBIOS结构表获取枚举到的设备的丝印信息和BDF信息,其中,第二枚举信息包括设备的Physical ID、设备厂家、设备型号、BDF信息和设备传输速率;
将所述第二枚举信息、所述丝印信息和所述BDF信息填充至所述设备的资产信息中。
结合第一方面,在一些实施例中,所述方法还包括:
在操作系统启动后,查询获取SMBIOS结构表的丝印信息,与显示命令lspci和BMC界面WEB端口中的丝印信息是否一致;
若不一致,则输出异常告警信息。
结合第一方面,在一些实施例中,所述BIOS通过所述BMC获取每个MCIO端口连接的设备的ID,包括:
所述BIOS向所述BMC中发送智能平台管理接口标准协议IPMI命令;
所述BMC根据所述IPMI命令,读取所述CPLD的所述寄存器中存储的数据,获取每个MCIO端口连接的设备类型的ID;
将所述每个MCIO端口连接的设备类型的ID进行格式转换,并返回所述BIOS。
结合第一方面,在一些实施例中,所述BIOS根据每个MCIO端口连接的设备的ID,以及预先配置的设备ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置,包括:
所述BIOS根据所述设备类型的ID与带宽信息之间的映射关系,查询获取每个MCIO端口连接的设备类型的ID对应的带宽信息;
针对每个设备类型,根据所述设备类型的ID对应的带宽信息对所述设备进行带宽配置。
结合第一方面,在一些实施例中,所述关系数据表中还包括:每个设备PhysicalID对应的中央处理器的PCIE设备端口CPU PCIE port。
结合第一方面,在一些实施例中,每个设备的资产信息包括:设备厂商、设备型号、设备传输速率、设备带宽和设备版本。
第二方面,本申请实施例还提供一种AI服务器的自适应配置装置,所述装置包括:数据收集模块,处理模块以及转换模块;
所述数据收集模块,用于在所述AI服务器上电后,收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
所述处理模块,用于:
通过所述转换模块获取每个MCIO端口连接的设备类型的ID;
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的第一枚举信息,所述第一枚举信息中包括所述设备的Physical ID和BDF信息;
基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述PCI设备的Physical ID对应的丝印信息,并将所述设备的所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个Physical ID对应的丝印信息。
第三方面,本申请实施例还可提供一种AI服务器,包括:CPLD,BMC以及BIOS;其中,所述BIOS包括SMBIOS结构表模块,redfish模块,分叉bifurcation模块;
所述CPLD通过总线连接所述BMC,所述BMC通过总线连接所述BIOS;
在所述AI服务器上电后,所述CPLD用于收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
在所述BIOS启动后,所述BIOS用于通过所述BMC获取每个MCIO端口连接的设备的ID;
所述BIOS用于:
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型的ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的枚举信息,所述枚举信息中包括所述设备的Physical ID和BDF信息;
基于枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个设备Physical ID对应的丝印信息。
第四方面,本申请实施例还可提供一种可读存储介质,所述可读存储介质中存储计算机执行指令,所述计算机执行指令被执行时用于实现如第一方面任一项所述的AI服务器的自适应配置方法。
本申请提供的AI服务器的自适应配置方法、装置、设备和存储介质,通过CPLD收集MCIO连接PCIE设备的连接信息,存储与CPLD的寄存器中。在BIOS启动后,BIOS通过BMC获取每个MCIO端口连接的设备类型的ID,根据得到的每个MCIO端口连接的设备类型的ID与预先配置的设备类型ID与带宽信息之间的映射关系得到设备类型配置带宽,根据该带宽进行带宽配置。BIOS在POST过程中枚举设备,基于枚举信息中的每个设备的ID,以及预先配置的每个设备ID对应丝印信息的关系数据表,获取该设备的ID对应的丝印信息,并将所述设备的所述丝印信息和所述BDF信息写入SMBIOS结构表。通过本方案不再需要对更换的设备进行手动配置,实现了自适应的配置带宽和丝印信息,无需人工参与,服务器系统可正常启动。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的AI服务器的自适应配置方法的一种应用场景示意图;
图2为本申请实施例提供的一种AI服务器的自适应配置方法实施例一的流程示意图;
图3为本申请实施例提供的一种AI服务器的自适应配置方法实施例二的流程示意图;
图4为本申请实施例提供的一种AI服务器的自适应配置方法实施例三的流程示意图;
图5为本申请实施例提供的一种AI服务器的自适应配置方法实施例四的流程示意图;
图6为本申请实施例提供的一种AI服务器的自适应配置装置实施例一的流程示意图;
图7为本申请实施例提供的一种AI服务器结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
首先对本申请实施例所涉及的硬件环境及名词做出解释:
BIOS:Basic Input Output System,基本输入输出系统,是一组固化到计算机内主板只读存储器(Read-Only Memory,简称:ROM)芯片上的程序,保存着计算机最重要的基本输入输出的程序、系统设置信息、开机上电自检程序和系统启动自检程序。
BMC:Baseboard Management Controller,基板管理控制器,BMC是一个独立的系统,具备一系列的监视和控制系统硬件的功能,不依赖与系统上的其它硬件(比如CPU、内存等),也不依赖与BIOS、操作系统OS等。
IPMI:Intelligent Platform Management Interface,智能平台管理接口,与BMC匹配的接口。是服务器、存储设备和通信设备等设备的硬件管理规范。通过该规范,用户可以使用IPMI协议监视服务器的物理健康特征。
CPLD:Complex Programmable Logic Device,复杂可编程逻辑器件,是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。
MCIO:Mini Cool Edge IO,内部电缆互连系统。
PCIE:Peripheral Component Interconnect Express串行计算机扩展总线标准。
POST:Power-On Self Test,开机自检。指计算机接通电源后,BIOS程序的行为,包括对CPU、系统主板、基本内存、扩展内存、连接设备等硬件进行检测。
SMBIOS:System Management BIOS,主板或系统制造者以标准格式显示产品管理信息所需遵循的统一规范,包括了服务器系统中所有的硬件信息,用户在操作系统里通过访问SMBIOS可以快速了解当前系统中所有的硬件配置信息。SMBIOS包含多个结构表,每个表的意义不同,Type0 BIOS信息、Type1系统信息、Type4处理器信息、Type9系统插槽信息等。
Bifurcation:一种PCIE通道拆分技术,可以灵活配置,组合或者拆分PCIE通道,决定各个设备和PCIE插槽的通道宽度,实现该功能一般有三种方式:通过硬件连接的方式决定PCIE通道的连接方式,一旦定义将不可修改;通过软件的方式修改配置,通过工具修改,这种修改一般和BIOS无关,修改后直接烧录BIOS;纯BIOS设置,在PCIE链路训练之前,通过BIOS对PCIE根复合体root complex的寄存器进行设置来确定通道宽度。
BDF:每一条总线(Bus),每一个设备(Device)和每一项功能(Function)。PCIe总线中的每一个功能(Function)都有一个唯一的标识符与之对应。这个标识符就是BDF(Bus,Device,Function),PCIe的配置软件有能力识别整个PCIe总线系统的拓扑逻辑,以及其中的每一条总线(Bus),每一个设备(Device)和每一项功能(Function)。
随着大数据的发展,人工智能(Artificial Intelligence,简称:AI)服务器的需求急剧增多,AI服务器产品中会使用多图形处理器(graphics processing unit,简称:GPU)来支持大数据计算,加上一些PCIE网卡和存储系统(Non-Volatile Memory express,简称:NVME)硬盘,从而构成一个完整的AI服务器系统。
为了兼容和自适应各种场合,AI服务器需要支持多配置组合,AI服务器的PCIE设备一般通过内部电缆互连系统(Mini Cool Edge IO,简称:MCIO),来连接。软件通过FRUID来区分配置,软件通过给定的FRUID来设置固定的配置,从而达到多配置需求,满足设计和运维要求。这种方案需要软件维护一张配置表,如果有配置改动,需要去更新配置表,修改软件来支持。
但不同的用户需要的配置各不相同,需要灵活的定制化配置,如果用户的定制化配置不在软件维护的配置表中,就会导致服务器系统异常,导致业务无法运行。
为解决上述问题,发明人在对该技术领域进行研究的过程中发现,在更换设备,更新软件配置表的过程主要在配置设备带宽和丝印相关信息。基于此,通过预先配置好的一个数据表,包含使用到的相关设备和带宽关系,可以通过识别连接设备类型,查到对应的带宽,对设备配置对应带宽,完成自适应。而对于设备连接的槽位的丝印信息,也通过预先配置好的设备的物理标识Physical ID和对应的丝印信息,在Post过程中,根据枚举信息中的设备的(Physical ID)去读取设备的丝印信息写入SMBIOS结构表中,在收集资产信息时,将SMBIOS结构表的丝印填充资产信息。这样就完成了设备的自适应的配置过程。基于此,本申请提供一种AI服务器的自适应配置方法。
本申请的技术方案主要应用于计算机设备,包括但不限于AI服务器。
图1为本申请实施例提供的AI服务器的自适应配置方法的一种应用场景示意图,如图1所示,该场景中,包括至少一个外接设备,服务器主板。外界设备可以为PCIE设备、PCI设备,对于具体的外界设备类型本方案不做限制。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请实施例提供的一种AI服务器的自适应配置方法实施例一的流程示意图,AI服务器主板包括CPLD,BMC以及BIOS,如图2所示,该方法包括以下步骤:
S101、在AI服务器主板上电后,通过CPLD收集获取MCIO连接设备的连接数据,并将连接数据写入寄存器,连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的ID。
在本步骤中,AI服务器主板在接通电源以后,首先CPLD先启动,再是BMC、BIOS启动,CPLD先于BIOS启动去收集主板连接设备的连接数据,用于在BIOS启动后获取该数据。连接数据中包括MCIO端口和设备类型的ID,其中设备类型的ID用于确认该设备的带宽,MCIO端口用于指示该设备带宽配置在哪个端口。具体的,CPLD通过寄存器可以识别到每个连接设备的类型及连接在哪个MCIO端口。CPLD将收集的连接数据写入寄存器。
S102、在BIOS启动后,BIOS通过BMC获取每个MCIO端口连接的设备类型的ID。
在本步骤中,BIOS启动后,BIOS需要对连接的PCIE设备完成带宽配置,首先要确定每个MCIO的端口下连接的PCIE设备类型,因此BIOS需要获取CPLD收集的连接数据。BIOS向BMC发送查询数据请求信息,BMC接收到请求信息后,BMC读取CPLD寄存器,获取连接数据,将连接数据转换成BIOS可识别的MCIO-设备类型ID的格式后发送给BIOS。
S103、BIOS根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对MCIO端口连接的设备进行带宽配置。
在本步骤中,为了能够识别设备到所需要的带宽,开发人员提前在BIOS内设置设备类型ID与带宽信息对应表。BIOS获取到每个MCIO端口连接的设备类型的ID,根据预先配置的设备类型ID和宽带信息的映射关系确定该设备的带宽,并对对应的MCIO接口进行带宽配置。具体的,采用PCIE通道拆分技术,可以灵活配置的组合或者拆分PCIE通道,通过BIOS对PCIE Root Complex的寄存器进行设置达到修改设备带宽的目的。将所有收集的设备带宽配置成功完成带宽自适应。要对连接的每个设备进行带宽配置。
在一种具体的实现方式中,为满足多个PCIE设备连接在AI服务器主板,通常设置与主板插槽连接的功能扩展Riser卡,Riser卡用于对插槽带宽的转换。同样的,CPLD可以收集Riser卡类型和连接在MCIO的端口位置的连接数据。例如Riser卡连接的PCIE设备是网卡,Riser卡将主板带宽x32的插槽转换为两个带宽为x16插槽,而该网卡为x8带宽的网卡,则需要对该网卡进行带宽配置,BIOS获取Riser卡类型,根据预设的该类型的带宽,对PCIERoot Complex的寄存器进行设置将Riser卡带宽修改为x8。
S104、BIOS在POST过程中枚举设备,得到每个设备的第一枚举信息,第一枚举信息中包括设备的ID和BDF信息。
在本步骤中,在BOSI启动后,进行开机自检POST过程,对CPU、系统主板、基本内存、扩展内存和连接的硬件设备进行检测。POST过程要执行SMBIOS包含的多个结构表,在SMBIOS结构表Type9初始化过程中,需要进行枚举,枚举AI服务器连接的所有设备,枚举得到每个设备的物理地址Physical ID和BDF信息,用于查找设备的丝印信息。具体的,枚举方式可以是,通过读PCIE设备配置空间的IO枚举或者通过接口PCIIO枚举,得到枚举信息。
S105、基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取PCIE设备的Physical ID对应的丝印信息,并将丝印信息和BDF信息写入SMBIOS结构表,其中,关系数据表中包括每个Physical ID对应的丝印信息。
在本步骤中,完成设备宽带自适应配置之后,还需要实现设备丝印的配置。在BIOS内部存储有预先由开发人员配置好Physical ID对应丝印信息的关系数据表,在Post过程枚举设备得到枚举信息,根据设备枚举信息中的Physical ID,在关系数据表中确定设备的Physical ID对应的丝印信息,将得到的丝印信息写入SMBIOS结构表,枚举得到的BDF信息也写入SMBIOS结构表,完成SMBIOS结构表的更新填充。
可选的,关系数据表中还包括每个设备的Physical ID对应的CPU PCIE port。
CPU的PCIE port与MCIO接口一一对应,每个连接设备的Physical ID连接在MCIO接口,通过查询CPU PCIE port也可以查询到设备的Physical ID对应的丝印信息。
本申请实施例提供的AI服务器的自适应配置方法,通过AI服务器主板的CPLD收集MCIO连接设备的连接数据,BIOS根据收集到的设备类型ID确认设备带宽,对带宽进行配置。Post过程中,BIOS枚举设备,根据设备的Physical ID从关系数据表中获取该设备PhysicalID对应的丝印信息,将丝印信息写入SMBIOS结构表。该方法可实现在更换设备后可自动适配带宽和丝印信息,避免人工配置的过程,可灵活满足用户需求。
图3为本申请实施例提供的一种AI服务器的自适应配置方法实施例二的流程示意图,如图3所示,在上述实施例基础上,该方法还包括以下步骤:
S201、在BIOS中的可扩展平台管理(redfish)模块启动过程中,收集每个设备的资产信息。
在本步骤中,为完成AI服务器系统的启动,还需要完成设备资产信息的配置。BIOS中的redfish模块启动过程中,BIOS负责收集每个设备的资产信息,并更新资产信息。资产信息用于在BMC的界面WEB显示,方便比对和查看设备资产信息。
S202、BIOS对设备进行枚举,得到第二枚举信息,并从SMBIOS结构表获取枚举到的设备的丝印信息和BDF信息,其中,第二枚举信息包括设备的ID、设备厂家、设备型号、BDF信息和设备传输速率。
在本步骤中,收集设备的资产信息要获得每个连接设备的详细信息,因此BIOS对设备进行枚举,得到第二枚举信息。枚举方式包括IO枚举、PCIIO枚举,本申请实施例对具体枚举方式不做限定。枚举得到的第二枚举信息包括设备的Physical ID、厂家型号、BDF信息,传输速率等详细信息,但枚举无法获得设备的槽位丝印信息,需要根据第二枚举信息中的设备的Physical ID从SMBIOS结构表获取该设备的丝印信息。
S203、将第二枚举信息、丝印信息和BDF信息填充至设备的资产信息中。
在本步骤中,为将资产信息补充完整,将获取的第二枚举信息和丝印信息和BDF信息写入设备的资产信息中,完成资产信息的配置。
可选的,每个设备的资产信息包括:设备厂商、设备型号、设备传输速率、设备带宽和设备版本。
可选的,在操作系统启动后,查询获取SMBIOS结构表的丝印信息,与显示命令lspci和BMC界面WEB端口中的丝印信息对比是否一致。
若丝印信息对比一致,则正常启动操作系统,若不一致,则在BMC WEB界面输出异常告警信息,通过这种方式再次确认丝印信息是否正确,防止写入SMBIOS结构表过程出现错误。比对信息还可以是其他资产信息,本实施例对具体比对的信息不做限制。
本申请实施例提供的AI服务器的自适应配置方法,通过枚举获取设备的详细信息,根据得到的枚举信息中设备的Physical ID从SMBIOS结构表查找到该设备的丝印信息,将丝印信息、BD信息和枚举得到的第二枚举信息写入资产信息中,通过这种方式不需要人工设置就可以实现丝印信息及资产信息的自适应配置。
图4为本申请实施例提供的一种AI服务器的自适应配置方法实施例三的流程示意图,如图4所示,在实施例一步骤102中,BIOS通过BMC获取每个MCIO端口连接的设备的ID,具体包括以下步骤:
S301、BIOS向BMC中发送IPMI命令。
在本步骤中,BIOS为配置设备带宽,首先要获取连接设备的设备类型,因此发送IPMI命令给BMC获取连接设备的数据,IPMI是与BMC匹配的接口,通过IPMI命令可以控制BMC实现查询功能。
S302、BMC根据IPMI命令,读取CPLD的寄存器中存储的数据,获取每个MCIO端口连接的设备类型的ID。
在本步骤中,BMC具备控制系统硬件的功能,BMC根据BIOS发送的查询连接数据的IPMI命令,通过集成电路总线(Inter-Integrated Circuit,简称:I2C)读取存储在CPLD中的连接数据,即获取每个MCIO端口连接的设备类型的ID。
S303、将每个MCIO端口连接的设备的ID进行格式转换,并返回BIOS。
在本步骤中,BMC获取到连接数据,要转变为BIOS可以识别的格式。具体的,将连接数据转变为MCIO-设备类型ID的格式,将转换后的数据发送给BIOS。BIOS根据该转换后的数据可以准确识别端口下的设备类型ID,可以根据设备类型ID确定带宽。
本申请实施例提供一种AI服务器的自适应配置方法,BMC收到BIOS的IPMI命令后,读取CPLD寄存器中的连接数据,BMC将连接数据转换为BIOS所需要的格式,发送给BIOS。通过这种方式实现BIOS获得可识别的设备连接数据。
图5为本申请实施例提供的一种AI服务器的自适应配置方法实施例四的流程示意图,如图5所示,在上述实施例一步骤103中,BIOS根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对MCIO端口连接的设备进行带宽配置,具体包括以下步骤:
S401、BIOS根据设备类型ID与带宽信息之间的映射关系,查询获取每个MCIO端口连接的设备类型的ID对应的带宽信息。
在本步骤中,BIOS内部有开发人员预先配置好的设备类型ID与带宽信息对应表,BIOS接收到BMC发送的MCIO-设备类型ID数据,根据该数据对设备进行带宽配置。具体的,BIOS根据数据中的设备类型ID数据,在预设的设备类型ID与带宽信息映射关系表中查询该设备类型的带宽信息。
S402、针对每个设备类型,根据设备类型的ID对应的带宽信息对设备进行带宽配置。
在本步骤中,获取每个设备类型的带宽,根据设备类型的带宽,对MCIO端口进行配置带宽,通过对PCIE Root Complex的寄存器进行设置,完成最终设备的带宽配置。
本实施例提供一种AI服务器的自适应配置方法,BIOS根据预设的设备类型ID与带宽信息之间的映射关系,得到设备类型的带宽,BIOS对设备带宽进行适配。通过本方案可以实现灵活的配置带宽,不需要再修改软件配置表,提高配置效率。
图6为本申请实施例提供的一种AI服务器的自适应配置装置实施例一的流程示意图,如图6所示,所述装置包括:数据收集模块311,处理模块312以及转换模块313;
所述数据收集模块311,用于在所述AI服务器上电后,收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
所述处理模块312,用于:
通过所述转换模块313获取每个MCIO端口连接的设备类型的ID;
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的第一枚举信息,所述第一枚举信息中包括所述设备的Physical ID和BDF信息;
基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述PCI设备的Physical ID对应的丝印信息,并将所述设备的所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个Physical ID对应的丝印信息。
可选的,所述处理模块312还用于:
在所述BIOS中的可扩展平台管理redfish模块启动过程中,收集每个设备的资产信息;
所述BIOS对设备进行枚举,得到第二枚举信息,并从SMBIOS结构表获取枚举到的设备的丝印信息和BDF信息,其中,第二枚举信息包括设备的Physical ID、设备厂家、设备型号、BDF信息和设备传输速率;
将所述第二枚举信息、所述丝印信息和所述BDF信息填充至所述设备的资产信息中。
可选的,所述处理模块312还用于:
在操作系统启动后,查询获取SMBIOS结构表的丝印信息,与显示命令lspci和BMC界面WEB端口中的丝印信息是否一致;
若不一致,则输出异常告警信息。
可选的,所述转换模块313具体用于:
所述BIOS向所述BMC中发送智能平台管理接口标准协议IPMI命令;
所述BMC根据所述IPMI命令,读取所述CPLD的所述寄存器中存储的数据,获取每个MCIO端口连接的设备类型的ID;
将所述每个MCIO端口连接的设备类型的ID进行格式转换,并返回所述BIOS。
可选的,所述处理模块312还用于:
所述BIOS根据所述设备类型的ID与带宽信息之间的映射关系,查询获取每个MCIO端口连接的设备类型的ID对应的带宽信息;
针对每个设备类型,根据所述设备类型的ID对应的带宽信息对所述设备进行带宽配置。
可选的,所述关系数据表中还包括:每个设备Physical ID对应的中央处理器的PCIE设备端口CPU PCIE port。
可选的,每个设备的资产信息包括:设备厂商、设备型号、设备传输速率、设备带宽和设备版本。
本申请实施例提供的AI服务器的自适应配置装置,可以执行上述方法实施例中的AI服务器的自适应配置方法,其实现原理和技术效果类似,在此不再赘述。
图7为本申请实施例提供的一种AI服务器结构示意图,包括:CPLD 211,BMC 212以及BIOS 213;其中,所述BIOS包括SMBIOS结构表模块411,redfish模块412,bifurcation模块413;
所述CPLD 211通过总线连接所述BMC 212,所述BMC通过总线连接所述BIOS 213;
在所述AI服务器上电后,所述CPLD 211用于收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
在所述BIOS 213启动后,所述BIOS用于通过所述BMC 212获取每个MCIO端口连接的设备的ID;
所述BIOS 213用于:
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型的ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的枚举信息,所述枚举信息中包括所述设备的Physical ID和BDF信息;
基于枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个设备Physical ID对应的丝印信息。
本申请实施例还提供一种可读存储介质,所述可读存储介质中存储计算机执行指令,所述计算机执行指令被执行时用于实现如前述任一方法实施例中所述的AI服务器的自适应配置方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种AI服务器的自适应配置方法,其特征在于,应用于人工智能AI服务器主板,所述AI服务器主板包括复杂可编程逻辑器件CPLD,基板管理控制器BMC以及基本输入输出系统BIOS,所述方法包括:
在所述AI服务器主板上电后,通过CPLD收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
在所述BIOS启动后,所述BIOS通过所述BMC获取每个MCIO端口连接的设备类型的ID;
所述BIOS根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
所述BIOS在上电自检POST过程中枚举设备,得到每个设备的第一枚举信息,所述第一枚举信息中包括所述设备的物理地址Physical ID和标识符BDF信息;
基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入产品管理信息统一规范SMBIOS结构表,其中,所述关系数据表中包括每个Physical ID对应的丝印信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述BIOS中的可扩展平台管理redfish模块启动过程中,收集每个设备的资产信息;
所述BIOS对设备进行枚举,得到第二枚举信息,并从SMBIOS结构表中获取枚举到的设备的丝印信息和BDF信息,其中,第二枚举信息包括设备的Physical ID、设备厂家、设备型号、BDF信息和设备传输速率;
将所述第二枚举信息、所述丝印信息和所述BDF信息填充至所述设备的资产信息中。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在操作系统启动后,查询获取SMBIOS结构表中的丝印信息,与显示命令lspci和BMC界面WEB端口中的丝印信息是否一致;
若不一致,则输出异常告警信息。
4.根据权利要求1或2所述的方法,其特征在于,所述BIOS通过所述BMC获取每个MCIO端口连接的设备类型的ID,包括:
所述BIOS向所述BMC中发送智能平台管理接口标准协议IPMI命令;
所述BMC根据所述IPMI命令,读取所述CPLD的所述寄存器中存储的数据,获取每个MCIO端口连接的设备类型的ID;
将所述每个MCIO端口连接的设备类型的ID进行格式转换,并返回所述BIOS。
5.根据权利要求1或2所述的方法,其特征在于,所述BIOS根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置,包括:
所述BIOS根据所述设备类型的ID与带宽信息之间的映射关系,查询获取每个MCIO端口连接的设备类型的ID对应的带宽信息;
针对每个设备类型,根据所述设备类型的ID对应的带宽信息对所述设备进行带宽配置。
6.根据权利要求1或2所述的方法,其特征在于,所述关系数据表中还包括:每个设备Physical ID对应的中央处理器的PCIE设备端口CPU PCIE port。
7.根据权利要求1或2所述的方法,其特征在于,每个设备的资产信息包括:设备厂商、设备型号、设备传输速率、设备带宽和设备版本。
8.一种AI服务器的自适应配置装置,其特征在于,所述装置包括:数据收集模块,处理模块以及转换模块;
所述数据收集模块,用于在所述AI服务器上电后,收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
所述处理模块,用于:
通过所述转换模块获取每个MCIO端口连接的设备类型的ID;
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的第一枚举信息,所述第一枚举信息中包括所述设备的Physical ID和BDF信息;
基于第一枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个Physical ID对应的丝印信息。
9.一种AI服务器,其特征在于,包括:CPLD,BMC以及BIOS;其中,所述BIOS包括SMBIOS结构表模块,redfish模块,分叉bifurcation模块;
所述CPLD通过总线连接所述BMC,所述BMC通过总线连接所述BIOS;
在所述AI服务器上电后,所述CPLD用于收集获取内部电缆互连系统MCIO连接设备的连接数据,并将所述连接数据写入寄存器,所述连接数据中包括至少一个MCIO端口,以及每个MCIO端口连接的设备类型的标识ID;
在所述BIOS启动后,所述BIOS用于通过所述BMC获取每个MCIO端口连接的设备的ID;
所述BIOS用于:
根据每个MCIO端口连接的设备类型的ID,以及预先配置的设备类型的ID与带宽信息之间的映射关系,对所述MCIO端口连接的设备进行带宽配置;
在POST过程中枚举设备,得到每个设备的枚举信息,所述枚举信息中包括所述设备的Physical ID和BDF信息;
基于枚举信息中的每个设备的Physical ID,以及预先配置的关系数据表,获取所述设备的Physical ID对应的丝印信息,并将所述丝印信息和所述BDF信息写入SMBIOS结构表,其中,所述关系数据表中包括每个设备Physical ID对应的丝印信息。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储计算机执行指令,所述计算机执行指令被执行时用于实现如权利要求1至7任一项所述的AI服务器的自适应配置方法。
CN202211697805.7A 2022-12-28 2022-12-28 Ai服务器的自适应配置方法、装置、设备和存储介质 Pending CN115878533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211697805.7A CN115878533A (zh) 2022-12-28 2022-12-28 Ai服务器的自适应配置方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211697805.7A CN115878533A (zh) 2022-12-28 2022-12-28 Ai服务器的自适应配置方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115878533A true CN115878533A (zh) 2023-03-31

Family

ID=85755737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211697805.7A Pending CN115878533A (zh) 2022-12-28 2022-12-28 Ai服务器的自适应配置方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115878533A (zh)

Similar Documents

Publication Publication Date Title
US10990415B2 (en) Disk management method and apparatus in ARM device and ARM device
US9710284B1 (en) System for programmably configuring a motherboard
CN106055361B (zh) 基于bmc的多种不同机型的集成式固件实现方法及系统
US20130080752A1 (en) Method and apparatus for implementing compatiblity of different processors
CN110489367B (zh) 一种灵活调配且易于cpld管理背板的方法与系统
CN114003538B (zh) 一种智能网卡的识别方法及智能网卡
CN115562738B (zh) 一种端口配置方法、组件及硬盘扩展装置
CN105653306A (zh) 显示启动设置界面的方法和装置
CN111143256A (zh) 一种读取现场可更换单元信息的方法和装置
CN103176913B (zh) 硬盘动态映射方法与应用其的服务器
US20240220439A1 (en) Motherboard and computing device
CN112698871A (zh) 在多cpu设备中使用option-rom的网络适配器配置
CN109117299B (zh) 服务器的侦错装置及其侦错方法
CN113434442A (zh) 一种交换机及数据访问方法
CN116560586A (zh) 属性值的确定方法及装置、存储介质及电子设备
CN114185720B (zh) 服务器动态热备份的方法、装置、设备及存储介质
CN101369257A (zh) 一种启动数据处理模块的方法、装置及系统
CN115878533A (zh) Ai服务器的自适应配置方法、装置、设备和存储介质
CN116048896A (zh) 故障检测方法及计算机设备
CN114253573A (zh) PCIe设备固件批量升级方法、系统、终端及存储介质
CN102082715A (zh) 网卡重置的测试方法
CN106548311B (zh) 库存管理设定系统
US12001373B2 (en) Dynamic allocation of peripheral component interconnect express bus numbers
US11977897B2 (en) Mounting position of NVMe or SATA on a backplane using bay slot ID
WO2023160699A1 (zh) 一种单板管理系统、方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination