CN115708040A - 一种主板及计算设备 - Google Patents
一种主板及计算设备 Download PDFInfo
- Publication number
- CN115708040A CN115708040A CN202111638881.6A CN202111638881A CN115708040A CN 115708040 A CN115708040 A CN 115708040A CN 202111638881 A CN202111638881 A CN 202111638881A CN 115708040 A CN115708040 A CN 115708040A
- Authority
- CN
- China
- Prior art keywords
- board
- expansion
- interface
- management
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 claims abstract description 62
- 230000002093 peripheral effect Effects 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 53
- 238000003860 storage Methods 0.000 claims description 39
- 238000012544 monitoring process Methods 0.000 claims description 28
- 230000005540 biological transmission Effects 0.000 claims description 20
- 230000001133 acceleration Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 22
- 238000007726 management method Methods 0.000 description 298
- 230000017525 heat dissipation Effects 0.000 description 67
- 238000013461 design Methods 0.000 description 27
- 238000000034 method Methods 0.000 description 27
- 230000006978 adaptation Effects 0.000 description 14
- 230000003993 interaction Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000009434 installation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000001816 cooling Methods 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000005057 refrigeration Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4063—Device-to-bus coupling
- G06F13/4068—Electrical coupling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/18—Packaging or power distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/266—Arrangements to supply power to external peripherals either directly from the computer or under computer control, e.g. supply of power through the communication port, computer controlled power-strips
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4063—Device-to-bus coupling
- G06F13/409—Mechanical coupling
- G06F13/4095—Mechanical coupling in incremental bus architectures, e.g. bus stacks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Human Computer Interaction (AREA)
- Power Engineering (AREA)
- Stored Programmes (AREA)
- Multi Processors (AREA)
Abstract
本申请公开了一种主板及计算设备。该主板包括基础板和扩展板,基础板,用于设置基础器件和外部接口;扩展板,用于扩展基础板的功能。其中,基础板通过其上的第一外部接口与扩展板的第二外部接口耦合。对传统的主板进行拆分,通过合理的处理器小系统和周边系统的划分,形成了仅仅包含处理器小系统的基础板,以及对输入输出和管理进行扩展的扩展板。降低了扩展器件的对基础板的影响程度,能够以实际需求灵活替换扩展器件。并可根据业务需求快速提供可商用主板,降低主板的开发周期以及开发成本。
Description
技术领域
本申请涉及计算设备技术领域,尤其涉及一种主板及计算设备。
背景技术
自上个世纪80年代起,微软和英特尔为推动个人电脑(personal computer,PC)产业的发展组成Wintel联盟,即两家公司在PC产业内密切合作,以推动Windows操作系统在基于英特尔中央处理器(central processing unit,CPU)的PC机上运行。Wintel联盟推动了包括个人电脑、服务器等计算设备中计算能力(也可以称为算力)的不断提升,使得计算设备在各行各业逐渐得到广泛应用,进而推动了计算产业的快速发展。
随着计算设备的应用场景、配置类型越来越多,计算设备中硬件的算力也呈现多样性趋势,这就对计算设备的跨架构共用部件、跨代演进、缩短上市时间(time to market,TTM)、降低成本等方面提出更高的要求。而包括传统的个人电脑、服务器等计算设备的主板(motherboard)的设计依赖于CPU的约束,且计算设备中内存条、硬盘、快捷外围部件互连标准(Peripheral Component Interconnect Express,PCIe)卡、风扇等组件往往又由不同厂商生产,不同厂商或不同型号的组件均需要分别设计不同的主板才能满足CPU与组件间适配的需求,这就导致主板的设计难度高、上市周期长、兼容性差等问题。因此,如何提供一种更通用的主板成为亟待解决的技术问题。
发明内容
本申请提供了一种主板及应用该主板的计算设备,通过主板架构设计的优化,在降低主板设计难度的基础上,降低主板开发周期,并能够提升主板兼容性。
第一方面,本申请提供一种主板,包括基础板和扩展板,基础板用于设置基础器件和第一外部接口,其中,基础器件包括处理器和内存;扩展板用于扩展基础板的功能;其中,基础板通过第一外部接口与扩展板的第二外部接口耦合,实现传统主板的功能。
通过上述描述可知,按照传统主板中器件的可标准化程度,提出组件化主板架构设计方案,达成基础板的极简化、标准化设计;同时,基础板不受扩展器件的电路影响,实现了基础板与扩展器件的解耦,降低了扩展器件的对基础板的影响程度,能够以实际需求灵活替换扩展器件。另外,不同厂商的IO组件等功能组件得以与基础板或通过扩展板与基础板实现灵活组合,进而根据业务需求快速提供可商用主板,并可降低主板的开发周期以及开发成本。
在一种可能的实施例,计算设备还包括扩展器件,用于扩展所述计算设备功能的器件。扩展器件包括功能组件,功能组件包括IO组件、存储组件、加速组件和内存扩展组件。其中,IO组件,用于实现计算设备与所算设备外部的器件或设备的通信,以及扩展计算设备的IO能力。存储组件,用于扩展计算设备的存储能力。加速组件,用于提供系统加速部件扩展和互连功能。内存扩展组件,用于提供系统扩展内存带宽、内存容量的功能。
在另一种可能的实施例,扩展板的数量可以为一个或多个。
在另一种可能的实现方式中,第一外部接口包括管理接口和数据接口,其中,管理接口用于实现基础板与扩展板之间传输控制信号;数据接口用于实现基础器件与扩展器件之间的数据交互。由此,分别实现板间及器件之间的管理控制以及相应功能的数据交互。
在另一种可能的实现方式中,数据接口包括支持快捷外围部件互连标准PCIe、计算快速链接CXL、融合总线UB、华为缓存一致性系统HCCS、串行连接小型计算机系统SAS以及串行高级技术附件SATA功能的接口中的至少一种。通过支持不同类型的接口可扩展基础板与扩展板或功能组件的数据传输方式,进而满足不同业务需求。
在另一种可能的实现方式中,扩展器件与数据接口连接,实现所述基础器件与扩展器件之间的数据传输。由于扩展器件可以通过基础板的数据接口与基础板相连,以扩展基础板的管理功能、IO能力和存储能力。
在另一种可能的实现方式中,扩展器件设置于扩展板,扩展板与数据接口连接,实现基础器件与扩展器件之间的数据传输。当扩展器件以插接等方式设置与扩展板时,扩展器件还可以通过扩展板与基础板之间的外部连接接口进行数据传输,同样可以实现扩展基础板的管理功能、IO能力和存储能力的目的。
在另一种可能的实现方式中,基础板的第一外部接口还包括第一供电接口,第一供电接口用于根据基础器件和/或扩展器件的供电需求供电。基础板可通过第一供电接口与供电组件连接,实现对基础器件或扩展器件的供电。由于基础板还可通过板间转接方式为扩展板上的扩展器件供电,实现供电资源的统一分配和管理,使得能耗效率得以合理控制。
在另一种可能的实现方式中,供电需求供电包括电压需求或功耗需求。
在另一种可能的实现方式中,第一供电接口通过线缆与供电组件相连,换言之,供电组件可通过线缆连到基础板,实现供电功能。
在另一种可能的实现方式中,基础板配置为具有多个板体尺寸,多个板体尺寸中一个板体尺寸根据处理器的配置数量和/或内存的配置数量设置。这样,对于不同应用场景下的功能配置,可以根据基础板上配置器件的数量和尺寸确定基础板的物理尺寸;基于组件化主板架构设计,满足相应的业务需求。
在另一种可能的实现方式中,基础板上开设有安装孔,以与计算设备的机框上固定结构相适配。进一步地,机框上的固定结构按位置关系被划分为至少一组固定结构,至少一组固定结构中一组固定结构可适配不同板体尺寸的基础板。也就是说,相对于机框上固定结构的划分规则,满足不同功能配置的基础板均得以与其中一组固定结构适配,具有较好的可适应性和可操作性;由此,一方面,可方便基础板与服务器机框之间的灵活组配安装,便于进行组装及检修维护操作;另一方面,应用该标准化安装接口形式,在具体应用中,可基于同一服务器机框的安装固定结构替换安装不同基础板,例如但不限于基于不同CPU型号、不同CPU架构(ARM/X86)或不同CPU厂家(intel/AMD/飞腾/鲲鹏)的基础板,以及不同基础板厂家的基础板进行直接替换,可满足差异化客户场景和应用需求。
在另一种可能的实现方式中,第二外部接口包括第二供电接口,当扩展器件包括供电需求小于第一阈值的器件时,第二供电接口用于与第一供电接口采用板间转接供电方式相连对扩展器件供电。这样,一方面可满足基础板上功耗较大的基础器件用电需求,同时,对于扩展板上扩展器件功耗相对较小的应用场景,基础板可按照器件的需求分压,并利用第二供电接口和第一供电接口建立板间转接供电方式,对扩展器件进行供电,配电方式更加合理。
在另一种可能的实现方式中,该扩展板上还包括供电组件接口、散热组件接口和机箱面板控制接口中至少一种,其中,供电组件接口用于通过线缆连接供电组件,散热组件接口用于实现传输所述扩展器件的散热控制信号,机箱面板控制接口用于传输机箱面板的控制信号。
在另一种可能的实现方式中,第二外部接口包括第二供电接口,当扩展器件包括供电需求大于或等于第二阈值的器件时,第二供电接口通过线缆与供电组件直接相连,以采用直接供电方式对所述扩展器件供电。也就是说,本方案的扩展板可以通过线缆与供电组件直接连接的方式供电,可应用于扩展板上扩展器件功耗相对较大的应用场景。
在另一种可能的实现方式中,第一阈值和第二阈值可以相同。
在另一种可能的实现方式中,第一阈值和第二阈值不同。
在另一种可能的实现方式中,扩展板还设置有用于识别并配置功能组件的基板管理控制器。由此实现计算设备中设备识别和监控管理功能。
在另一种可能的实现方式中,基础板还设置有用于识别并配置功能组件的基板管理控制器。
在另一种可能的实现方式中,该基板管理控制器可以设置为基板管理控制卡,且该基板管理控制卡与扩展板通过插槽连接,可快速实现基板管理控制器和基础板的连接和拆卸,当基板管理控制器出现故障时,可单独拆卸基板管理控制器,以实现快速运维管理。
在另一种可能的实现方式中,基板管理控制器预设有管理对象模板,功能组件中预设有与管理对象模板对应的硬件自描述信息;该基板管理控制器用于获取功能组件的所述硬件自描述信息,并根据管理对象模板和所述硬件自描述信息生成管理对像实例,通过管理对像实例识别,这样,功能组件的生产厂家不再局限于CPU的架构、版本或型号,只需要遵循基础板上的外部接口的标准定义,并按照标准定义的硬件自描述信息定义配置相应的硬件自描述信息,即可通过BMC实现功能组件的自动发现和自动配置。使得基础板与功能组件解耦后,功能组件的生产厂家具有更大的设计和生产灵活性,能够促进IO组件等功能组件的生产厂家的开发和进步。同时,通过管理对像实例对功能组件实现监控管理,监控管理包括温度控制和合法性校验中至少一种。
在另一种可能的实现方式中,基板管理控制器可以配置有组件发现模块和模板解析模块;其中,该组件发现模块用于获取功能组件中存储的硬件自描述信息,以识别相应的该功能组件;该模板解析模块用于解析硬件自描述信息,并根据管理对象模板生成管理对象实例。
在另一种可能的实现方式中,硬件自描述信息包括硬件基本信息、管理拓扑信息、管理器件信息和监控告警信息。其中,硬件基本信息用于识别相应功能硬件或基础板,例如但不限于包括便于自动识别适配的规范版本、组件类型、组件标识、组件厂商以及各种版本号等属性类别;管理拓扑信息用于创建功能组件的管理拓扑,例如但不限于包括温感、电压传感器和连接器等类别;管理器件信息用于识别功能组件的属性,例如但不限于包括器件类型、器件厂家型号、产品线号以及其他必要信息等属性类别;监控告警信息用于监控功能组件的工作状态,用于指示功能组件是否正常运行,例如但不限于包括传感器类型、传感器子类型、传感器监控对象、监控频率、传感器当前计数、告警值和告警门限以及其他必要信息等属性类别。
在另一种可能的实现方式中,基板管理控制器还可以配置有组件监控模块,用于监控管理相应的功能组件。
在另一种可能的实现方式中,硬件自描述信息还包括散热信息,该散热信息包括温度控制阈值。
示例性的,管理对象实例包括前述建议目标温度和最高温度门限,采集其实时温度的温度传感器可由硬件自描述信息中的温度传感器确定,同时根据硬件自描述信息中的建议目标温度、最高门限温度完成自适应散热控制。可灵活适配不同的功能组件,对于新的功能组件或器件可实现自适应散热管理,无需重新测试和升级温度管理软件,实现智能散热管理。
在另一种可能的实现方式中,基板管理控制器还用于根据硬件自描述信息监控功能组件的状态,确保计算设备的运行可靠性。
在另一种可能的实现方式中,扩展板和/或功能组件中包括现场可更换单元描述信息,基板管理控制器通过读取现场可更换单元描述信息,获取扩展板和/或功能组件的一层管理拓扑信息,并根据一层管理拓扑信息,建立组件管理拓扑;根据组件管理拓扑扩展基板管理控制器的管理端口,提高了管理效率。
在另一种可能的实现方式中,现场可更换单元描述信息中包括扩展板或功能组件的标识,该基础板中包括计算设备可兼容性列表;基板管理控制器还用于读取所述现场可更换单元描述信息与所述计算设备可兼容性列表,根据所述现场可更换单元描述信息与所述计算设备可兼容性列表判断所述扩展板或所述功能组件是否允许被接入至所述计算设备。
示例性的,可以通过板卡的序列号或其他唯一标识板卡的信息确定板卡的合法性,当检测到新接入的板卡的标识满足编号规则或其他校验方式时,可以认定新接入的板卡为合法板卡;当检测到新接入的板卡的标识不满足编号规则或其他校验方式时,可以认定新接入的板卡为非法板卡,以有效避免非法增加板卡。例如但不限于,限制板卡数量不合理增加,以及限制非合规厂商提供的板卡。
在另一种可能的实现方式中,现场可更换单元描述信息包括指示用于监测所述功能组件环境温度的传感器标识;基板管理控制器还用于根据所述传感器标识、硬件自描述信息中所述散热信息和所述管理对象模板生成所述管理对像实例。
在另一种可能的实现方式中,现场可更换单元描述信息中写有对应扩展板或功能组件的槽位号,该基板管理控制器中设有扩展板或功能组件的名称与槽位号的管理对应关系表。
第二方面,本申请还提供了一种计算设备,该计算设备包括主板,且主板采用如前所述的主板,以实现相应的功能或连接关系。该计算设备可以为应用主板的不同计算场景,例如但不限于,计算机、服务器、边缘设备等。
第三方面,本申请还提供了一种基础板,该基础板用于设置基础器件和第一外部接口,基础器件包括处理器和内存;且该基础板通过第一外部接口与扩展板的第二外部接口耦合。基础板用于实现上述第一方面或第一方面的任意一种可能的实现方式中相应的功能。
在一种可能的实现方式中,该第一外部接口包括管理接口和数据接口,其中,管理接口用于实现所述基础板与所述扩展板之间传输控制信号;数据接口用于实现所述基础器件与所述扩展器件之间的数据交互。
在另一种可能的实现方式中,基础板的第一外部接口还包括第一供电接口,第一供电接口用于根据基础器件和/或扩展器件的电压需求供电。例如但不限于,基础板可通过电源转换电路进行直流点或交流电之间的转换,并按照基础板中的器件的需求进行分压为相应的器件供电,能耗效率得以合理控制。示例性的,第一供电接口通过线缆与供电组件相连,换言之,供电组件可通过线缆连到基础板,实现供电功能。
在另一种可能的实现方式中,基础板配置为具有多个板体尺寸,多个板体尺寸中一个板体尺寸根据处理器的配置数量和/或内存的配置数量设置。这样,对于不同应用场景下的功能配置,可以根据基础板上配置器件的数量和尺寸确定基础板的物理尺寸;基于组件化主板架构设计,满足相应的业务需求。
在另一种可能的实现方式中,基础板上开设有安装孔,以与计算设备的机框上固定结构相适配。进一步地,机框上的固定结构按位置关系被划分为至少一组固定结构,至少一组固定结构中一组固定结构可适配不同板体尺寸的基础板。由此,一方面,可方便基础板与服务器机框之间的灵活组配安装,便于进行组装及检修维护操作;另一方面,应用该标准化安装接口形式,可满足差异化客户场景和应用需求。
第四方面,本申请还提供了一种主板组件的自适配方法,包括以下步骤:在基板管理控制器上预设管理对象模板,在功能组件上预设与所述管理对象模板对应的硬件自描述信息;获取接入到主板上的所述功能组件的硬件自描述信息;根据所述硬件自描述信息和对应的所述管理对象模板生成管理对像实例,通过运行所述管理对像实例识别并配置所述功能组件。
在一种可能的实现方式中,该硬件自描述信息还包括散热信息,所述散热信息包括温度控制阈值,所述基板管理控制器根据所述散热信息,利用所述管理对象模板生成管理对像实例,通过运行所述管理对像实例实现对所述功能组件的温度管理。
在另一种可能的实现方式中,功能组件上还设有现场可更换单元描述信息,所述基板管理控制器通过读取所述现场可更换单元描述信息,获取所述功能组件的一层管理拓扑信息,并根据所述一层管理拓扑信息建立组件管理拓扑;根据所述组件管理拓扑扩展所述基板管理控制器的管理端口。
在另一种可能的实现方式中,该现场可更换单元描述信息中写有对应所述功能组件的标识,所述主板上设有主板配置信息,所述基板管理控制器根据读取到的所述现场可更换单元描述信息与所述主板配置信息的比较结果,判断所述功能组件是否合法,所述主板配置信息包括所述标识。
在另一种可能的实现方式中,该现场可更换单元描述信息中指定用于所述功能组件进行环境温度监测的传感器标识,所述基板管理控制器根据所述传感器标识,利用所述散热信息和所述管理对象模板生成所述管理对像实例。
在另一种可能的实现方式中,该现场可更换单元描述信息中写有对应所述扩展板或所述功能组件的槽位号,所述基板管理控制器中设有所述扩展板或所述功能组件的名称与所述槽位号的管理对应关系表。
第五方面,提供一种基板管理控制器,该基板管理控制器包括处理器,处理器用于实现上述各个方面或各个方面中任意一种可能的实现方式所实现的功能。
第六方面,提供一种基板管理控制器,所述基板管理控制器包括用于执行上述各个方面或任意一个方面方面的任一种可能实现方式中的自适配方法的各个模块。
第七方面,提供一种芯片,该芯片用于执行上述各个方面或任意一个方面方面的任一种可能实现方式中的自适配方法的各个模块。
第八方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
第九方面,本申请提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
图1为本申请提供的一种主板的结构示意图;
图2为本申请提供的一种基础板的结构框图;
图3为本申请的扩展板和各功能组件与基础板连接的结构示意图;
图4为基于本申请提供的一种服务器的结构示意图;
图5为本申请实施例提供的服务机框上固定结构的布置示意图;
图6为本申请提供的一组不同物理尺寸基础板的结构示意图;
图7为本申请实施例提供的一种基板管理控制器的结构示意图;
图8为本申请实施例提供的一种硬件自描述信息的逻辑关系图示意图;
图9为本申请实施例提供的一种BMC生成管理对象实例的流程示意图;
图10为本申请实施例提供的一种自适应散热控制的流程示意图;
图11为本申请实施例提供的一种组件管理拓扑自发现和管理增强功能的流程图。
具体实施方式
为了便于描述,首先对本申请涉及的名词术语解释如下。
计算设备,用于实现数据处理和设备管理控制的电子设备,例如,计算机、服务器、边缘设备等。
基础器件,用于提供通用计算能力的最小系统所包括的器件,例如中央处理器(central processing unit,CPU)和内存(main memory)。
扩展器件,用于扩展基础板的功能的器件,扩展器件又可以称为功能组件。其中,功能组件又包括输入输出组件(input/output unit,IOU)、存储组件(storage unit,STU)、加速组件(acceleration unit,ACU)、内存扩展组件(memory expansion unit,MEU)等实现计算设备的扩展功能的器件。
IO组件,用于实现所述计算设备与所述计算设备外部的器件或设备的通信,以及扩展计算设备IO能力。IO组件包括Riser等部件,实现对计算设备中系统IO的扩展,IO组件支持PICe卡(也可以称为PCIe标卡)、开放计算项目(Open Compute Project,OCP)卡。可选地,IO组件还包括网卡、显卡、独立磁盘冗余数组(redundant array of independentdisks,RAID)卡、键盘、鼠标、扫描仪、摄像头、显示器、打印机等输入输出设备。
存储组件,用于扩展计算设备的存储能力。示例地,存储组件包括用于实现计算设备的文件或数据的储存功能,例如硬盘驱动器等。
加速组件,用于提供系统加速部件扩展和互连功能。包括Riser、载板、加速卡互连交换机(switch)、业务驱动基础架构(Service Driven Infrastructure,SDI)卡、加速卡、片上系统(System on Chip,SoC)卡等。
内存扩展组件,用于提供系统扩展内存带宽、内存容量的功能,包括载板、内存扩展芯片、存储级内存(storage class memory,SCM)、双列直插内存模块(dual in-linememory module,DIMM)等。
可选地,扩展器件还可以用于实现计算设备内控制和管理功能。示例地,扩展器件还包括机箱面板控制组件。具体地,将机箱面板控制电路以独立形式(例如,板卡)设置的器件称为机箱面板控制组件。
值得说明的是,具体实施中,根据功能组件处理速度的差异又可以将硬盘驱动器、图形处理单元(graphic processing unit,GPU)(也可以称为显卡)等需要进行高速数据传输的功能组件称为高速功能组件,将IO接口电路需要进行低速数据传输的功能组件称为低速功能组件。
处理器,包括CPU、专用集成电路(application-specific integrated circuit,ASIC)、可编程逻辑器件(programmable logic device,PLD)、复杂程序逻辑器件(complexprogrammable logical device,CPLD)、现场可编程门阵列(field-programmable gatearray,FPGA)、通用阵列逻辑(generic array logic,GAL)、片上系统(system on chip,SoC)、软件定义架构(software-defined infrastructure,SDI)芯片、人工智能(artificial intelligence,AI)芯片等任意一种处理器或其任意组合。
散热组件,用于对计算设备或计算设备中硬件进行散热,包括风冷散热、液冷散热或二者结合等几种散热方式的组合。散热组件可以被处理器或基板管理控制器(baseboardmanagement controller,BMC)或其他类型的控制器控制,以实现对计算设备中基础器件或扩展器件的散热功能。此外,应理解的是,散热组件的结构、类型和数量不构成对本申请所要保护技术方案的限定。
板卡,是指一种带有插芯的印制电路板(print circuit board,PCB),可以通过插槽接入计算设备,用来控制硬件的运行,比如显卡、采集卡等,安装驱动程序后,即可实现相应的硬件功能;或者,用来实现数据传输或其他功能。
下面结合附图详细解释本申请提供的主板架构。
为了解决传统服务器主板存在设计难度高、上市周期长、兼容性差等问题,本申请提供了一种全新的组件化设计的主板架构,将传统的一体式主板,按照主板上的器件可标准化程度拆分为多个子板。将传统主板中可标准化的器件设置在一个子板中,该子板也可以被称为基础板(basic computing unit,BCU),而将对基础板的管理扩展的器件设置在另一个子板中,该子板也可以称为扩展板(extension unit,EXU),扩展板用于扩展基础板的管理功能,作为整个系统的管理中心,提供设备、安全、能效和可靠性等管理功能。基础板和扩展板分别通过各自的外部接口耦合,实现板间连接;外部接口还用于基础板或扩展板分别与IO组件、存储组件、加速组件或内存扩展组件等扩展器件的数据通信。由此在出现处理器需更新换代或处理器的算力扩容等需求时,仅需要针对基础板进行替换或改进,无需重新设计和更换扩展板,降低了设计难度,同时提升了扩展板的兼容性。
其中,可标准化的器件可根据能提供通用计算能力的最小系统进行划分。示例地,处理器和内存可提供通用计算能力,可以将其设置在基础板上,其他IO组件或存储组件等扩展器件则可以通过扩展板或基础板的外部接口接入计算设备,由此解耦传统主板中处理器与其他器件的关联性。可选地,器件的标准化程度也可以根据与计算设备启动的关联度划分,还可以根据计算设备可运行的最小系统划分。
值得说明的是,传统主板可以被拆分为一个基础板和一个扩展板,也可以是一个基础板和多个扩展板。为了便于描述,以下实施例以一个基础板和一个扩展板为例进行说说明。
接下来,以计算设备为服务器,且服务器中处理器为CPU为例进行说明。此外,扩展器件与基础板或扩展板的连接方式可以根据业务需求灵活组合,为了便于描述,以下实施例中以扩展器件为IO组件和存储组件为例进行说明。
图1为本申请提供的一种主板的结构示意图。如图所示,主板1000包括基础板10和扩展板20。基础板10,用于设置服务器启动所必须的基础器件和第一外部接口11。扩展板20,用于配置不影响服务器启动的扩展器件和第二外部接口21,基础板10通过第一外部接口11与扩展板20的第二外部接口21耦合。扩展器件,用于实现基础板的扩展功能的器件。其中,基础器件和扩展器件可以根据器件的硬件属性分别通过插槽实现与基础板10或扩展板20的连接,也可以通过板卡形态分别与基础板10或扩展板20连接,还可以通过针(pin)、集成形式与基础板10或扩展板20连接。硬件属性包括类型、型号、性能参数、所支持的通信接口等硬件相关的参数。
进一步地,扩展板20上可设置基板管理控制器40,基板管理控制器40用于实现计算设备中硬件的自动识别和监控管理配置,并与基础板10中基础器件进行通信,实现计算设备中数据交互。参见图3,图3为一种本申请提供的扩展板和各功能组件与基础板连接的结构示意图,如图所示,基板管理控制器40可以采用PCIe插卡形式,插接设置在扩展板20上,线条61显示的是高速接口、线条62和线条63显示的供电接口,图中未示出管理接口和低速接口。可选地,基板管理控制器40也可以采用针、集成或其他方式实现其与扩展板20的连接。
在传统主板架构下,IO接口电路、机箱面板控制电路等主板的扩展器件也集成在主板上,构成一体式主板。在主板计开发的过程中,不仅需要考虑CPU架构与内存匹配兼容的影响,还需要考虑IO接口电路、机箱面板控制电路等扩展器件与CPU和内存之间的匹配兼容。一方面,由于不同架构和代次的CPU的限制,另一方面,由于扩展器件也受到CPU架构和代次的影响,造成主板开发设计难度高,主板开发成本及开发周期均无法得以有效控制。另外,大体量的硬件集成在一体式主板上,也使得传统架构的主板制造成本相对较高。此外,对于服务器来说,不同形态的服务器主板无法共享,设计成本和制造成本均无法得以合理控制的问题较为显著。
相对于传统主板,本申请所公开的基础板10,仅配置有服务器可标准化的基础器件,构成了极简化的计算单元。基础板10的设计和开发不需要关注CPU对IO组件、存储组件、机箱面板控制组件等的影响,并将开发重点放在CPU和内存等服务器启动所必须的基础器件的性能和匹配兼容性上,一方面简化了基础板的开发,另一方面,IO组件和存储组件等功能组件的配套生产商也无须考虑CPU的影响,同样简化了功能组件的开发,从而形成了基础板和功能组件各自独立开发的模式,改变了传统一体式主板的架构、设计模式和开发模式。
下面结合图2详细介绍本申请提供的一种基础板的结构示意图。
不同服务器可以根据设置业务需求设置一个或多个CPU以满足不同算力的要求,在本申请所提供的全新主板架构中,单个基础板可设置一个或多个CPU,以及不同数量的内存插槽。如图所示,基础板上配置有两个CPU 12,两个CPU 12之间,以及任意一个CPU 12与基础板10外的硬件之间均可通过高速输入/输出(high speed input/output)接口耦合。每个CPU 12根据需要匹配相应数量的内存13插槽,每个CPU还分别通过高速输入/输出接口连接多个融合总线连接器(Unified Bus Cable,UBC)(也可以称为统一总线连接器)或融合双密度总线连接器(Unified Bus Connectors-Double Density,UBC-DD)(也可以称为统一双密度总线连接器),融合总线连接器或融合双密度连接器可以分别与IO组件或存储组件等扩展器件耦合。此外,处理器还可以灵活配置成处理器所支持的快捷外围部件互连标准(Peripheral Component Interconnect Express,PCIe)、计算快速链接(Compute ExpressLink,CXL)、融合总线(unified bus,UB或Ubus)等总线接口形式,以实现基础板的器件间,以及基础板的器件可基于高速输入/输出接口与IO组件或存储组件等扩展器件进行通信和数据传输。其中,高速输入/输出接口包括高速串行接口(high speed serial port,Hisport)。可选地,高速输入/输出接口还包括华为缓存一致性系统(Huawei CacheCoherence System,HCCS)总线(用于实现多个处理器(例如,人工智能处理器)之间的高速互联,并且支持多芯片之间的缓存一致性功能)、串行连接小型计算机系统接口(SerialAttached Small Computer System Interface,SAS)总线、串行高级技术附件(SerialAdvanced Technology Attachment,SATA)总线等可用于器件间连接的总线的接口中至少一种,实现基础板中器件间,以及基础板的器件和扩展器件间的连接和数据传输。
可选地,为了满足CPU等类型的基础器件的数据处理需求,基础板10上还可以配置有时钟电路14和复杂可编程逻辑器件15(complex programmable logic device,CPLD),其中,CPLD可以通过基础板10的管理输入/输出(management input/output)总线与CPU相连,以便于CPLD和CPU之间传输管理信号或管理指令。
可选地,基础板上还可以配置基本输入输出系统(basic input output system,BIOS)、闪存(FLASH)等器件中的至少一种。
此外,结合图1和图3,基础板10上的第一外部接口11包括有数据接口(图中未示出)和管理接口(图中未示出)。其中,数据接口,用于进行数据交互,包括高速接口和低速接口,高速接口用于实现基础板10中的CPU等器件与功能组件利用高速传输协议进行数据传输。例如,基础板10中的CPU与存储组件1(例如,硬盘)采用PCIe总线协议进行高速数据交互。低速接口,用于实现基础板10中的CPU等器件与功能组件利用低速传输协议进行数据传输。例如,基础板10中的CPU与存储组件301采用SAS总线协议进行低速速数据交互。管理接口,用于实现基础板10中的CPU等器件与机箱面板控制器组件203,基板管理控制器等硬件之间传输控制类信号。例如,CPU可以通过管理接口向机箱面板控制组件203等功能组件以及散热组件302等传输控制信号。数据接口可以通过快捷外围部件互连标准PCIe、计算快速链接CXL、融合总线UB、华为缓存一致性系统HCCS、串行连接小型计算机系统接口SAS以及串行高级技术附件SATA中的至少一种实现数据传输。
进一步地,为了实现图1所示主板架构的供电,基础板可以通过外部接口与电源(也可以称为电源模块或电源组件或供电模组或供电组件)连接,而外部接口包括供电接口,基础板可以通过上述供电接口实现对基础器件和/或扩展器件的供电。为了便于描述,可以将基础板的外部接口称为第一外部接口,用于为基础板的器件供电的供电接口称为第一供电接口。将扩展板的外部接口称为第二外部接口,用于扩展板的器件供电的供电接口称为第二供电接口。
具体地,第一供电接口可以连接电源转换器,以将电源提供的输入电源转换成基础器件运行所需的电压。可选地,第一供电接口也可以为连接在基础板上的功能组件提供所需电压。
接下来,以图3为例进一步介绍基础板和扩展板的连接关系。图3为本申请提供的一种扩展板20与基础板10的连接示意图。请参考图1和图3,基础板10上配置有两个CPU12以及与内存13,扩展板20与基础板10分别通过基础板10上的第一外部接口(图中未示出)和扩展板20的第二外部接口(图中未示出)耦合。供电组件201与基础板10相连。第一外部接口11还包括第一供电接口,用于连接供电组件201获取输入电源,并根据基础板10中的基础器件10和扩展板20中的供电需求实现各组件的供电。
值得说明的是,供电需求可以由多种形式表示,例如,电压、功耗等参数均可以用于标识组件的供电需求,为了便于描述,以下实施例中以供电需求为电压需求为例进行说明。
在实际应用中,每个组件的电压需求不同(例如,100伏或10伏),而供电组件201提供的电压为一固定值(例如,220伏),直接将供电组件提供的电压分配给器件会因供电电压过大导致器件损坏或因供电电压过小导致该器件无法工作。因此,供电组件201需要根据基础板或扩展板中设置器件或链接组件的电压需求对不同硬件进行供电。
作为一种可能的实施例,供电组件201可以通过线缆直连供电方式或板间转接供电方式中任意一种方式实现为基础板或扩展板中器件的供电。
方式1,当器件的电压需求小于或等第一阈值时,采用板间转接供电方式实现供电组件201和基础板10或扩展板20的连接。
方式2,当器件的电压需求大于或等于第二阈值时,采用线缆直连供电方式实现供电组件201和基础板10或扩展板20的连接。
其中,第一阈值和第二阈值可以相同,也可以不同。具体实施中,可以根据硬件属性进行设置。
为了便于理解,下面结合一个示例详细解释供电组件201、基础板10和扩展板20之间的连接方式。
通常地,基础板10中CPU的电压需求较大,扩展板20中器件的电压需求较小。此时,基础板10可以采用直连供电方式供电,扩展板20则可采用板间转接方式供电。具体地,供电组件201可通过线缆直接与基础板10相连,基础板10通过第一供电接口进行直流(directcurrent,DC)/交流电(alternating current,AC)转换,并按照基础板10中的器件或连接扩展器件的需求进行分压,进而为基础板中各个器件供电。扩展板20的第二供电接口可以与基础板10的第一供电接口相连,由基础板10统一进行电压分配,并根据扩展板20中器件的供电需求实现资源分配此外
值得说明的是,第一供电接口可以实现电源转换电路的功能,即第一供电接口可以实现直流和交流的转换等供电转换需求的功能。可选地,基础板10中还可以在第一供电接口外部设置电源转换电路,由该电源转换电路实现直流和交流的转换等供电转换需求的功能。
应当理解,第一外部接口11是第一供电接口、数据接口和管理接口的集合,而非物理形态上的一种插槽。在物理形态上,第一外部接口11可以有多种形态,例如,第一供电接口、数据接口和管理接口可以分别被设置为一个独立接口,也可以是集成接口,即供电接口、数据接口和管理接口由一个接口实现。
进一步地,基于第一外部接口11的不同形态,扩展板20、功能组件30、散热组件302可以分别采用以下方式与基础板10连接:
方式1、扩展板20通过插槽与基础板10相连。
基础板10上设有插槽,扩展板20设有与插槽相适配的插口,并通过该插口插接在基础板10上的插槽内,从而接入基础板10,扩展板20与基础板10通过插槽进行交互。
方式2、功能组件通过扩展板20接入基础板10。
扩展板20通过插槽插接在基础板10上,功能组件(例如,图3中IO组件202)连接到扩展板20上,扩展板20利用第一外部接口11中的管理接口与基础板10进行通讯,例如,通过内部集成电路(Inter-Integrated Circuit,IIC或I2C)协议进行低速数据交互。其中,I2C是一种简单、双向二线制同步串行总线,只需要两根线即可在连接于总线上的器件之间传送信息。
在一个具体实施例中,基础板10插槽中的管理接口为兼容I2C总线协议的串口,扩展板20插接在基础板10上的插槽上,与基础板10通过I2C总线通信,例如,插接在具有通用串行总线(Universal Serial Bus,USB)接口的板卡202上,由此实现板卡与基础板10之间可通过I2C总线实现数据交互,完成数据输入和操控功能。
显卡等高速IO组件也可以采用类似的方式,通过扩展板20接入基础板10。具体地,扩展板20通过插槽插接在基础板10上,显卡等IO组件通过扩展板20上接口连接到扩展板20上,并利用外部接口11中的高速接口与基础板10进行通讯,例如通过PCIe总线进行高速数据交互。在一个具体实施例中,扩展板20插接在基础板10上,与基础板10通过PCIe总线通讯,扩展板20上设有PCIe插槽,具有PCIe接口的显卡插接在扩展板20的PCIe插槽上,由此,通过扩展板20,显卡与基础板10通过PCIe总线实现高速数据交互。
方式3、功能组件或散热组件直接接入基础板10。
在具体实现中,可以将散热组件通过插槽插接基础板10,并利用该插槽与基础板10进行低速数据交互,例如通过I2C总线协议传输管理控制信号,进而实现对器件的散热功能。
类似地,硬盘驱动器等存储组件也可以通过插槽或连接器接入基础板10。具体来说,基础板10上还具有与第一外部接口11中的高速接口相同的插槽,硬盘驱动器等存储组件插接在基础板10上的插槽上,并利用插槽与基础板10进行高速数据交互,例如通过PCIe协议,由此,实现对硬盘驱动器等存储组件的高速读写。
其他的功能组件,均可以通过上述相应的方式接入基础板10,从而实现数据传输或管理控制,在此不再一一举例说明。
值得说明的是,插槽可以分为单体插槽和集成插槽,单体插槽是指将第一供电接口、数据接口和管理接口分别单独构建成基础板上不同的单体插槽,集成插槽是指将第一供电接口、数据接口和管理接口集成在一起构建在基础板上,或者,将第一供电接口、数据接口和管理接口任意两两组合,分别构建在基础板上。
可以理解的是,功能组件与扩展板或基础板的具体物理连接方式可根据实际产品设计需要进行选择,以兼顾计算设备内部空间利用率的需求。
作为一种可能的实现方式,表1示出了一种第一外部接口11的接口的示例,具体包括接口类型、接口名称和功能描述。
表1一种第一外部接口的示例
值得说明的是,上述第一外部接口的分类仅为一种示例,具体实施过程中,可以根据业务需求选择不同的接口传输不同类型的信号或数据,各种类型的接口所包括的具体接口的分类并不构成对本申请的限定。
基于表1中第一外部接口的描述,基础板10通过第一供电接口输入直流12V电源,再通过基础板10上的电源转换模块(例如但不限于直流-直流转换模块),转换成基础板10上各器件和功能组件运行所需的相应电压。当然,基础板10的输入电压也不限于直流12V,还可采用直流48V等其它电压。
需要说明的是,PCIe接口是当前大部分处理器支持的高速接口,考虑到CPU的升级换代及不同架构CPU的差异化,本实施例中的高速接口除了可以采用PCIe接口之外,还可以采用CXL/UB/HCCS/SAS/SATA等接口形式,具体实现中,上述的PCIe/CXL/UB/HCCS/SAS/SATA等接口,可以通过但不限于采用UBC和UBC-DD连接器形成的Flexible I/O接口模式灵活配置获得。
接下来,结合图4进一步解释包含本申请的主板架构的服务器的结构示意图。
如图4所示,服务器包括机框1001,机框1001内包括基础板10、扩展板20以及存储组件301和散热组件302。基础板10通过固定孔101与机框1001上的固定结构适配,实现基础板10和机框1001的固定连接。基础板10上配置有两个CPU 12,每个CPU匹配设置多条内存插槽,每条内存插槽内分别插接一条内存13,扩展板20与基础板10连接。扩展板20上设有供电接口、数据接口。供电组件201、用于为计算设备供电。基板管理控制器40通过插槽插接在扩展板20上。存储组件301和散热组件302分别通过插槽插接在基础板10上。
为了满足业务需求,可以根据基础板上配置器件的数量和尺寸确定基础板的物理尺寸。在具体实现中,基础板10上配置硬件的种类或数量不同,基础板10板体的物理尺寸也会不同,物理尺寸以(长度×宽度)表示。表2为一组基础板物理尺寸的示例,包括六种物理形态基础板。
表2一组基础板物理尺寸的示例
其中,表2中“P”表示处理器的个数,“DPC”则表示每个通道双列直插内存模块(dual in-line memory module per channel,DIMM Per Channel)。
下面结合附图进一步介绍不同尺寸的基础板与机框的固定方式。
作为一种可能的实施例,基础板上开设有安装孔,并通过安装孔以与图4中所示服务器机框上固定结构相适配。为了能够确保机箱适应多种不同物理形态的基础板,以适应基础板的更新和升级换代,通过复用机箱上的多个固定结构中的部分固定结构实现不同尺寸的基础板与机箱的固定连接,降低工程设计的难度。
参考图1中基础板10,以开设四个固定孔101作为例,基于上述原则设定各安装孔的孔径尺寸,及各安装孔之间在横向和纵向上的相对位置,即可将基础板可靠组装在机框上对应的安装位置处。根据机框上的多个固定结构,配置设定不同物理形态基础板上相应的安装孔,一方面,可方便基础板与服务器机框之间的灵活组配安装,便于进行组装及检修维护操作;另一方面,应用该标准化安装孔位的形式,在具体应用中,可基于同一服务器机框的安装位替换安装不同基础板,例如但不限于基于不同CPU型号、不同CPU架构(ARM/X86)或不同CPU厂家(intel/AMD/飞腾/鲲鹏)的基础板,以及不同基础板厂家的基础板进行直接替换。如此设置,能够满足差异化客户场景和应用需求。
在具体实现中,可以将机框上的固定结构按位置关系被划分为至少一组固定结构,至少一组固定结构中一组固定结构可适配不同尺寸的基础板。也就是说,基于所适配CPU的配置数量和内存的配置数量,基础板可以具有不同尺寸,且相应尺寸的基础板上的各安装孔间的相对位置及孔间距不完全相同,本方案中机框上固定结构的分组之一可与其适应,由此满足不同尺寸的基础板快速拆装操作;在其他具体实现中,可将至少部分固定结构被划分在至少两个固定结构组中,作为机框上的固定结构分组规则,可进一步提高可适应性。
需要说明的是,基础板上的安装孔可以包括固定孔101和定位孔102。其中,固定孔101用于通过紧固件固定在相应的固定结构上,例如但不限于螺钉或卡扣件;定位孔102用于通过限位件定位在固定结构上,例如位销。此时,机箱中适配于固定孔101的固定结构可以为螺钉孔,机箱中适配于定位孔102的固定结构可以为导向孔。当然,在其他具体应用中,固定结构也可以采用其他结构形式,只要满足快速拆装基础板的功能需要均可。
可选地,除了以图1所示的基础板10中设置四个安装孔外,还可以根据基础板的大小设置更多或更少的安装孔,安装孔的数量并不构成对本申请的限定。
下面结合图5和图6详细说明如何复用机框中固定结构。
如图5所示,机框上各固定结构包括十二个螺钉孔(1~12)和两个导向孔(A、B),十二个螺钉孔(1~12)可被划分为三组,分别为尺寸界线A2、B1和B2所示。在具体组装时,对于不同类型的基础板,选择不同的孔位,机箱设计时遵循相应的螺钉安装约束规范,例如,在机箱内中可用于设置固定结构的区域内,根据基础板的尺寸和重量中至少一种方式设置固定结构的数量和位置,则可以实现同一机箱同时支持图6所示的A2、B1、B2三种基础板。其中,机箱内中可用于设置固定结构的区域基于机箱中所需放置的印刷电路板、风扇、风道挡板、电源、风扇等硬件所需占用的空间和布局,为固定机构预留的空间,该空间的大小和位置可根据业务需求设置。
请一并参见图6,该图分别示出了表2中A2、B1和B2三种不同的基础板的结构示意图。
如图所示,图6(a)示出了表2中A2形态的基础板,其上配置有一个CPU,采用每个通道两个DIMM插槽(2DIMM Per Channel)的架构,由此,该基础板配置了十六条内存插槽,十六条内存插槽分为两组,分别布置在CPU的两侧。图6(b)示出了表2中B1形态的基础板,其上配置有两个中央处理器CPU,采用每个通道一个DIMM插槽(1DIMM Per Channel)的架构,由此,该基础板配置了十六条内存插槽,十六条内存插槽分为四组,每组四条内存插槽,分别布置在两个CPU的两侧。图6(c)示出了表2中B2形态的基础板,其上配置有两个中央处理器CPU,采用每个通道两个DIMM插槽(2DIMM Per Channel)的架构,由此,该基础板配置了三十二条内存插槽,三十二条内存插槽分为两组,分别布置在两个CPU的两侧。
上述三种形态基础板上的固定孔,分别对应于机框上所划分的三组螺钉孔,如下表3所示。
表3一种基础板中螺钉孔的示例
基础板号 | 螺钉孔 | 导向孔 |
A2 | 2、3、5、6 | A、B |
B1 | 2、7、8、5、11、12 | A、B |
B2 | 1-12 | A、B |
本实施例中,机框上的螺钉孔2、5在A2形态基础板、B1形态基础板和B2形态基础板的组装中被复用,螺钉孔2、3、5、6在A2形态基础板和B2形态基础板的组装中被复用,螺钉孔5、7、8、11和12在B1形态基础板和B2形态基础板的组装中被复用。可以理解的是,在其他不同服务器机框尺寸下,可依据上述复用原则划分螺钉孔,以替换不同性能形态的基础板。
另外,本实施例中基础板与机框的装配关系中,还通过定位孔和导向孔的设计提供预装定位功能。当然,图5所示的两个导向孔A、B,被图中所示的三种形态的基础板共用。可以理解的是,基于可替换板体尺寸跨度较大的情形,也可以依据上述复用原则划分导向孔,在此不再赘述。
由此可见,不同种类的基础板,通过物理尺寸及安装孔位兼容等参数的标准化约束,可互换适配于同一服务器机框,方便了基础板的升级换代。
通过将传统的主板拆分为可标准化的基础板和扩展板,基础板10上仅配置提供通用计算能力的CPU和内存等基础器件,可最大灵活地适配功能组件,简化了设计,节省了开发量,降低主板设计周期和难度。进一步地,根据处理器的数量和大小分别设置不同尺寸的基础板,当需要对计算设备实现算力扩容或涉及更换处理器类型的跨平台升级时,仅需更换基础板即可快速完成算力扩容或跨平台升级操作,提升了扩容或升级的处理效率。此外,系统中个组件之间完全解耦,相互之间的物理接口、电气特性、管理协议和参数都实现标准化,而除了基础板外,其它各模块的物理尺寸均可以根据需要进行定义、选择,使得主板架构设计更灵活,可以满足不同业务需求。
作为一个可能的实施例传统主板除了被拆分为一个基础板和一个扩展板外,扩展板可以为多个,具体实施过程中,可以将IO组件、存储组件、加速组件或内存扩展组件等扩展器件按照功能的差异分别接入一个或多个扩展板,然后再通过其接入的扩展板与基础板连接。示例地,扩展板可以根据功能划分为外设交互扩展板、数据处理扩展板等,以利于扩展器件的管理。或者,可以根据器件的不同划分为存储组件扩展板或IO组件扩展板等。
可选地,除了按照硬件类型实现扩展器件和扩展板的连接外,也可以根据待接入扩展器件的数量和尺寸与一个或多个扩展板相连,进而通过扩展板与基础板相通信。还根据可集成化程度,或不同生产商划分为多个扩展板,每个扩展板可以通过外部接口与基础板连接。
作为一种可能的实施例,基于上述主板的结构,本申请还提供一种计算设备中功能组件自动识别和配置管理的技术方案。在功能组件上预设该功能组件的硬件自描述信息,在基板管理控制器BMC配置相应的功能组件管理对象模板,根据功能组件的硬件自描述信息生成功能组件的管理对象实例,进而实现功能组件自动识别和监控管理。这样,IO组件等功能组件的生产厂家,不再局限于CPU的架构、版本或型号,只需要遵循基础板上的外部接口的标准定义,并按照标准定义的硬件自描述信息定义配置相应的硬件自描述信息,即可通过BMC实现功能组件的自动发现和自动配置。使得基础板与IO组件等功能组件解耦后,功能组件的生产厂家具有更大的设计和生产灵活性,能够促进IO组件等功能组件的生产厂家的开发和进步。
应当理解,基于本申请实施例硬件自描述信息和管理对象模板的设计构思,本申请实施例中的基础板和扩展板同样可以预设自描述信息,并通过在基板管理控制器BMC配置相应的管理对象模板,进一步优化主板设计。
具体地,基础板内置有基于基础板管理对象模板定义的基础板自描述信息,基板管理控制器BMC上预设有基础板管理对象模板,基板管理控制器BMC采用基于基础板管理对象模板的方式,识别和配置处理器和内存等硬件信息,并生成基础板管理对象实例,实现基础板的自动识别和适配管理。该实施例,不仅提高了处理器、内存等的兼容能力,且只要配置有不同架构、不同型号或版本的处理器的管理对象模板,即可对不同架构、不同代次的CPU自动适配,无须升级基板管理控制器BMC软件,方便了基础板的升级维护。
进一步地,扩展板上内置基于扩展板管理对象模板定义的扩展板自描述信息,具体可以包括扩展接口描述信息、管理接口描述信息等,相应地,基板管理控制器BMC预设有扩展板管理对象模板,根据扩展板自描述信息生成扩展板管理对象实例,实现了扩展板的自动识别和适配管理。这样,当扩展接口或管理接口的标准改变时,例如接口定义改变、接口速率改变等,基板管理控制器BMC可以通过该扩展板自描述信息和相应的管理对象模板构建获得新的接口,无须重新设计开发扩展板,无须升级基板管理控制器BMC软件,提高了扩展板的适应能力和兼容性。
本实施例提供的主板,BMC可支持IO组件等功能组件的自动识别、配置。对应于不同类别的功能组件,基板管理控制器预置有对应不同类型的功能组件的管理对象模板,每种类型的管理对象模板分别用于记录各个类型的器件的信息,例如,序列号、生产厂商、类型等信息。
根据不同类型的管理对象模板,不同类别的功能组件分别限定了硬件自描述信息,并将硬件自描述信息存储至该功能组件的存储区域。基础板在上电后,基板管理控制器可以获取功能组件存储区域中硬件自描述信息,进而实现基板管理控制器的硬件自动探测和识别功能,再将硬件自描述信息中的配置信息写入BMC中对应的管理对象模板中对应的位置,从而创建该功能组件的具体管理对象实例,相当于功能组件的驱动,从而实现相应功能组件的自动识别、配置。
进一步地,基于该机制能够全面支持组件的自动发现和配置,实现组件的免代码开发管理,并对外提供服务器设备管理功能。应用于本方案,更换同CPU系列基础板的新机型可以直接开机运行;当然,对于跨CPU系列的基础板,BMC中设定相应CPU系列的软件版本,也可以兼容更换。
下面以功能组件的自动识别适配为例,详细说明本申请基于基板管理控制器BMC实现功能组件的自动识别适配的详细技术方案。
请参见图7,该图示出了本申请实施例基板管理控制器的软件模块组成的示意框图,通过基板管理控制器实现对功能组件的自动识别和监控管理。其中,对应于不同类别的功能组件30,基板管理控制器预设有与各功能组件对应的管理对象模板71,同时,对应于不同类别的功能组件(301…30n),并分别定义了相应的硬件自描述信息。
如图8所示,硬件自描述信息可包括硬件基本信息、管理拓扑信息、管理器件信息、监控告警信息。其中,硬件基信息,用于识别相应功能硬件或基础板,包括便于自动识别适配的规范版本、组件类型、组件标识(identifier,ID)、组件厂商以及各种版本号等属性类别。“规范版本”,是指符合指定规范的版本号,例如,BMC定义的规范版本号,以便于统一管理。“组件类型”,是指扩展板、基础板、IO组件、加速组件(例如,加速卡、片上系统、业务驱动基础架构卡)等,以对应不同类型的管理对象模板。“组件ID”,也即表示组件的ID号,基于BMC规范中定义的其生成规则形成,例如但不限于,“厂家ID+序列号”的形式。在具体实现中,可根据不同组件类型的特点确定其硬件基本信息的主要构成。管理拓扑信息,用于创建功能组件的管理拓扑,包括温度传感器、电压传感器、连接器、I2C MUX(复用器,multiplexer)等类别。管理器件信息,用于识别功能组件的属性,包括器件类型、器件厂家型号、产品线号以及其他必要信息等属性类别。监控告警信息,则用于监控功能组件的工作状态,用于指示功能组件是否正常运行,包括传感器类型、传感器子类型、传感器监控对象、监控频率、传感器当前计数、告警值和告警门限以及其他必要信息等属性类别。其中,传感器类型包括温度传感器、电压传感器、电流传感器等,温度传感器又分为热电阻传感器和热电偶传感器两种子类型。其他传感器的类型和子类型按行业常识划分,在此不再一一赘述。传感器当前计数即为传感器的检测值,告警值表示告警的上限值或下限值单一的物理量,告警门限表示由告警上限和告警下限形成的数值范围区间。当然,对于需要在系统运行过程中实时监控的组件来说,例如硬盘,该类型组件的硬件自描述信息还包括监控告警信息,例如但不限于散热信息。这样,当硬盘的工作温度超出门限值时,则执行相应的散热管理控制。
通常,不同类型功能组件的个体功能及管理要求均有各自特点,相应的自描述信息需要根据组件类型分别进行设定。
基于以上描述,在各功能组件内的存储区域存储硬件自描述信息,主板在上电后,基板管理控制器自动探测接入的功能组件,并通过读取该功能组件上固定存储区域获取其硬件自描述信息,将硬件自描述信息解析后组装到管理对象模板中创建该功能组件的管理对象实例,从而实现本申请中各功能组件的自动识别和监控管理。
可以理解的是,基于上述管理控制逻辑定义的硬件自描述信息,出厂时即由配套厂商预设在该功能组件的存储区域中,使得灵活组合的功能组件满足该主板架构下的自动识别、适配。
相较于传统主板架构,本实施中基板管理控制器的管理软件与被管理的功能组件解耦,功能组件更新或替换不会产生重新开发软件或升级软件的开发投入。换言之,传统主板为了适配新设计的功能组件,需要升级基板管理控制器的管理软件,增加新设计的功能组件的定义和硬件信息,以进行识别和应用。而本申请方案,基板管理控制器上的管理对象模块是标准化的统一结构,各功能组件将其硬件自描述信息保存在相应的功能组件自身上,当新设计的功能组件接入在主板上之后,通过读取该功能组件的硬件自描述信息,并适配于相应的管理对象模板中,即可自动生成管理对象实例,基板管理控制器的管理软件不需要升级就能够自动识别出该新设计的功能组件,并进行自动适配,使新设计的功能组件得以正常使用。
功能组件的自动识别和自适配过程如图7和图9所示,当新的功能组件(301…30n)增加到主板上之后,基板管理控制器可通过组件发现模块72获取各功能组件的硬件自描述信息,组件解析模块73对硬件自描述信息进行解释,并按照管理对象模板71自动生成和该功能组件对应的管理对象(如:传感器管理对象、芯片管理对象等),由组件管理模块74进行管理。
这里,所生成的管理对象自身包含了新功能组件所必要的管理信息,确保基板管理控制器能对新的功能组件进行自适应管理,由此,在功能组件灵活组合的不同应用场景下,根据本方案基板管理控制器管理机制,通过自动获取新接入的功能组件本身的自描述信息,能够达成管理新接入的功能组件的功能。
作为一种可能的实施例,不同类型硬件所对应的硬件自描述信息不完全相同,以分别满足管理适配需求。下面以显卡为例,管理对象模板根据硬件自描述信息生成管理对象实例的具体过程如下:
步骤1、显卡通过PCIe接口接入到基础板或扩展板后,基板管理控制先从显卡中读取读取显卡的硬件自描述信息,包括:功能组件的名称(显卡),显卡的型号、生产厂商等硬件基本信息,以及分辨率、刷新频率等性能参数。
步骤2、基板管理控制器根据该显卡硬件自描述信息中的硬件基本信息,查找到相应的管理对象模板。
步骤3、基板管理控制器对解析硬件自描述信息获得该显卡的管理拓扑信息、管理器件信息、监控告警信息,将上述硬件自描述信息组装到管理对象模板中,自动生成显卡管理对象实例。
另外,在计算设备运行过程中,还可以通过基本管理控制器BMC的组件监控模块85对每个功能组件进行监控。
此外,在其他实施例中,还可以在功能组件的硬件自描述信息中定义散热信息,以实现对散热有特殊要求的功能组件自定义灵活管理,具体可通过在硬件自描述信息中定义功能组件的建议目标温度和最高温度门限实现。
作为一种可能的实现方式,本申请还提供一种自适应散热控制方法的技术方案。参见图10,图10为本申请提供的一种自适应散热控制方法的流程图。自适应散热控制由散热管理程序完成,散热管理程序可以存储在基板管理控制器中或BIOS中。这里,以散热管理程序存储在基板管理控制器中为例,针对有散热要求的功能组件,基板管理控制器利用比例积分微分(proportional-integral-derivative,PID)控制算法,以传感器获得功能组件的实时温度T、功能组件的目标温度T0和最高门限温度Tmax作为该PID控制算法的输入,执行散热管理控制。其中,实时温度T,用于指示功能组件当前温度;目标温度T0,则用于指示功能组件件可正常工作的温度或温度范围;最高门限温度Tmax,则用于指示功能组件运行的极限温度,超过该温度则会导致器件损坏或无法正常工作。实时温度T、功能组件的目标温度T0和最高门限温度Tmax因器件的类型或厂商的不同而不同。对于不同散热要求的功能组件,功能组件的目标温度T0和最高门限温度Tmax设定温度不同,以显卡为例,散热管理的目标温度T0=50℃,最高门限温度Tmax=95℃,自适应散热控制方法包括以下步骤:
S101、基板管理控制器BMC通过温度传感器采集功能组件显卡的实时温度T。
其中,温度传感器设置在显卡上或可采集显卡实时温度T的有效范围内,温度传感器与基础板或扩展板相连,并通过管理接口与基板控制器BMC进行通信。
S102、基板管理控制器BMC判断实时温度T是否小于目标温度T0(50℃);若是,则执行步骤S103,根据比例积分微分控制算法,按照1%的步进降低风扇转速;若否,则执行步骤S104。
S104、判断实时温度T是否大于最高门限温度Tmax(95℃);若是,则执行步骤S105,紧急处理或告警;若否,则执行步骤S106,根据比例积分微分控制算法,按照1%的步进提高风扇转速。
上述散热控制方法,通过提高风扇转速或降低风扇转速,对功能组件进行散热,使得功能组件的实时温度T趋近于目标温度T0,从而满足功能组件工作温度的要求。
对于在位功能组件,接入基础板或扩展板后可由基板管理控制器BMC自动识别并配置,然后创建生成所对应的管理对象实例,管理对象实例包括前述目标温度和最高温度门限。用于采集该功能组件的实时温度的温度传感器可由功能组件的硬件自描述信息中的温度传感器确定,也就是说,可基本管理控制器可以通过硬件自描述信息确定与该功能组件关联的温度传感器。可选地,用于监控功能组件温度的传感器也可以由基板管理控制器选定,也就是说,基本管理控制器可根据服务器中温度传感器的位置和有效监测范围,指定任意一个温度传感器收集指定功能组件的温度信息。同时根据硬件自描述信息中的目标温度、最高门限温度完成自适应散热控制。相较于传统主板架构,本方案可灵活适配不同的功能组件,对于新的组件或器件可实现自适应散热管理,无需重新测试和升级温度管理软件,实现智能散热管理。
当然,对于采用风冷方式实现温度调节的散热方案,需要如前述通过改变风扇转速的管理机制进行控制。而对于采用液冷方式实现温度调节的散热方案,则可以通过控制制冷循环当中制冷工质的流量,例如便不限于控制相应制冷工质流路的启闭,以及改变流量开度大小进行控制。需要说明的是,利用风扇进行风冷散热和利用制冷工质相变换热提供散热的方式,具体功能实现非本申请的核心发明点所在,且本领域技术人员基于现有技术能够实现,故本文不再赘述。
下面结合一个具体示例,进一步介绍基于本申请提供的组件化主板实现供电组件和显卡的散热管理。
在该实施例中,供电组件的散热由电源风扇实现,显卡的散热由显卡风扇实现。供电组件散热的建议目标温度和最高门限温度被记载在供电组件的硬件自描述信息中,显卡散热的建议目标温度和最高门限温度被记载在显卡的硬件自描述信息中,供电组件和显卡接入基础板后,通过BMC读取供电组件和显卡中的硬件自描述信息,从而获得电源散热和显卡散热的建议目标温度和最高门限温度,并据此进行供电组件和显卡的散热管理。当更换上新的供电组件和显卡后,由于新的供电组件和显卡的建议目标温度和最高门限温度存在于新的供电组件和显卡的硬件自描述信息中,因此,通过BMC读取后,就会生成新的供电组件和显卡散热方案,而不需要升级主板管理程序,使得主板散热方案能够根据功能组件自动适配。
作为一种可能的实施例,本申请还可以利用BMC实现服务器中功能组件或扩展板合法性验证,具体地,BMC可以利用现场可更换单元描述信息(Field Replaceable UnitDescription,FRUD)完成组件管理拓扑信息识别,进而基于组件管理拓扑信息实现管理增强功能,包括:BMC管理端口扩展、非法增加板卡管理、自定义温度管理以及组件槽位灵活适配等。其中,基础板、扩展板和功能组件上均可设置FRUD。
如图11所示,利用FRUD实现组件管理拓扑自发现和管理增强功能的流程如下:
步骤S111,基板管理控制器BMC上电启动。
步骤S112,判断基板管理控制器BMC的管理软件中是否预设有管理增强功能,且管理增强功能处于开启模式,如果是,则执行步骤S113;如果否,则执行步骤S114。
步骤S113,运行增加管理功能。
步骤S114,读取BMC所在板卡的FRUD信息,获取到BMC管理端口信息。
BMC通常设置于扩展板,作为一种可能的实现方式,BMC也可以设置于基础板。BMC管理端口信息中指定了BMC管理端口号以及对应的功能组件的器件访问地址。
步骤S115,BMC根据BMC管理端口信息中的BMC管理端口号,判断该BMC管理端口是否使能,如果是,执行步骤S116;否则,结束流程。
步骤S116,BMC读取BMC管理端口对应的功能组件的FRUD信息,并根据功能组件的FRUD信息建立组件管理拓扑。
如果基板管理控制器BMC的管理软件中不具有管理增强功能,则直接获取BMC管理端口信息,并通过该管理端口,读取各功能组件的FRUD信息,形成组件管理拓扑。
其中,管理增强功能可以作为选配功能,通过授权开启,例如,通过输入或更新激活码获得管理增强功能授权。获得授权后,可以自动或手动开启、关闭管理增强功能。
基于上述组件管理拓扑,本申请实施例实现的管理增强功能详细说明如下:
第一、BMC管理端口扩展。
通常情况下,BMC管理端口的数量有限,而被管理对象的数量要远大于BMC管理端口的数量。这里,被管理对象可以是基础板、扩展板以及功能组件关联的器件,例如,温度传感器、电压传感器、电流传感器等,用于检测不同器件的工作状态。本实施例中,利用自发现组件管理拓扑机制,建立BMC管理端口与功能组件上的器件之间的组件管理拓扑,利用该组件管理拓扑可以直接访问到对应功能组件上的器件,实现了对BMC管理端口的扩展。
以对扩展板上的BMC管理端口进行扩展为例,在该实施例中,基板管理控制器BMC设置在扩展板上,扩展板上的FRUD信息中,填写有扩展板上每个BMC管理端口的扩展拓扑信息,该扩展拓扑信息用于指定该BMC可以直接访问到的各功能组件中的器件地址。基板管理控制器BMC上电启动之后,通过读取扩展板上的FRUD信息,就可以获取每个BMC管理端口可以访问到的功能组件上的器件的地址,从而建立BMC与各功能组件上的器件的可访问地址的一层管理拓扑信息,根据一层管理拓扑信息实现对BMC管理端口的扩展。例如,通常情况下,BMC管理端口与功能组件上的器件访问地址的对应关系固化在BMC管理软件中,因此,一个BMC管理端口只能管理对应的功能组件上的一个器件。而本实施例中,BMC管理接口与各功能组件上的器件访问地址写在FRUD信息中,而不是固化在BMC管理软件中,BMC通过读取FRUD信息后,就可以建立BMC管理端口与各功能组件上的器件之间的一层管理拓扑信息,该一层管理拓扑信息可以指定任意一个BMC管理端口与任意的功能组件上的任意器件的对应关系,进而可以根据该对应关系访问到指定功能组件上的对应器件,实现了BMC管理端口的扩展。这里,一层管理拓扑是指BMC到每个功能组件的管理接口可以直接访问到的器件组成的拓扑,例如,存储硬件自描述信息的存储器必须位于一层管理拓扑,这样BMC可以直接获取到该功能组件的硬件自描述信息。进一步地,硬件自描述信息中可以描述功能组件内部扩展的二层,甚至三层管理接口,例如,管理接口使用I2C总线,功能组件的内部可能会通过I2C、多路转换器(multiplexer,MUX)对I2C通道进行扩展,扩展后的I2C拓扑就属于第二层管理拓扑。
在一个具体的实施例中,电源组件上设有温度传感器、电流传感器和电压传感器,需要对上述三个传感器进行控制管理。本实施例中,基板管理控制器BMC通过读取扩展板上的FRUD信息,获得扩展板上的BMC管理端口与电源组件上的温度传感器、电流传感器和电压传感器的一层管理拓扑信息,通过该一层管理拓扑信息,一个BMC管理端口就可以访问到对应的温度传感器、电流传感器和电压传感器三个传感器,并实现相应的控制管理。
第二、非法增加板卡管理。
计算机或服务器生产厂商,对于其出售的成品计算机或服务器,并不希望用户或他人安装非本生产厂商生产或指定的板卡。其中,生产厂商生产或指定的板卡称为合法板卡,非生产厂商生产或指定的板卡称为非法板卡,可以通过对板卡设定标识(identifier,ID)来识别该板卡为合法板卡或非法板卡。例如,可以通过板卡的序列号(serial number,SN)或其他唯一标识板卡的信息确定板卡的合法性,当检测到新接入的板卡的标识满足编号规则或其他校验方式时,可以认定新接入的板卡为合法板卡;当检测到新接入的板卡的标识不满足编号规则或其他校验方式时,可以认定新接入的板卡为非法板卡。
为了有效避免非法增加板卡,本申请实施例还可以进一步增设限制功能。例如但不限于,限制板卡数量不合理增加,以及限制非合规厂商提供的板卡。
具体地,功能组件的FRUD信息中写有该板卡的ID,而BMC上设有该主机设备配置信息,包括基础板配置以及相应板卡的配置数量和ID。
当板卡接入到主板上之后,基板管理控制器BMC读取该功能板卡上的FRUD信息,并获取到该板卡的ID号,通过将从FRUD信息中获取到板卡的ID号与基础板配置信息中相应板卡的ID号进行对比,从而确认该板卡是否合法。
对于合法的板卡,基板管理控制器BMC读取该板卡的硬件自描述信息,构建该板卡的管理对象实例,完成了板上的自适配,使得该板卡可以正常使用。
而对于非法的板卡,基板管理控制器BMC不再读取该板卡的硬件自描述信息,因而无法构建该板卡的管理对象实例,使得该板卡无法使用。
为了进一步提高通用性,可以将BMC上主机设备配置信息中板卡的ID号更换为ID号序列范围或通配符,例如A001-A100,或者A1$,这样,位于该ID号序列之内的板卡都会被视为合法板卡。
基于上述方案,本申请还能够方便地进行主板远程配置升级,例如:在用户购买升级服务后,例如升级扩展内存,主板制作厂商可以通过网络更新基础板上的主板配置信息,这样,用户购买到扩展内存卡之后,插入到基础板或扩展板上就可以自动识别和适配,进而正常使用。
第三、自定义计算设备内部环境温度管理。
大多数的计算设备,通常设置有多个散热装置,例如,电源散热器、CPU散热器、显卡散热器、机箱散热器等。相应地,机箱内也会设置多个温度传感器,以获得相应器件的实时温度。对于某些计算设备,由于个性化配置,不同的功能组件会提出对环境温度和散热的特殊要求。为此,本申请实施例利用功能组件上的FRUD信息,实现了自动适配不同环境温度的管理功能。
具体地,可以在功能组件上的FRUD信息中,指定计算设备中的哪个传感器的检测值做为该功能组件的环境监测温度,以满足特殊散热要求(如环境温度的特殊要求)。例如,对于散热要求较高的显卡、电源等功能组件,FRUD信息中可以指定与中央处理器位置相应的温度传感器作为确定其环境温度的匹配传感器,并提供针对性地进行散热管理。而对于散热要求较低的硬盘等功能组件,可以采用内存附近的温度传感器作为确定其环境温度的匹配传感器,并提供针对性地进行散热控制。
这样,一方面可以灵活配置不同功能组件的散热管理方案,另一方面也无须为每一个需要进行散热管理的功能组件分别配置温度传感器,进而减少了温度传感器的布置数量,节约了成本。
第四、组件槽位灵活适配。
为便于管理,根据整机的要求,需要把整机配置的各个功能组件和该整机的槽位号或者名称对应起来。相较于传统服务器的固定槽位关系,本实施例的基板管理控制BMC可以将功能组件所插槽位号写入该功能组件中的FRUD中,并建立管理对应关系,实现了功能组件槽位号或者组件名称的重定义,灵活适配,便于管理;同时,也实现了该整机的面板物理槽位与实际组件使用的内部槽位的对应,避免因整机类型不同而导致需要通过软件升级使功能组件所在槽位号之名称对应。
作为一种可能的实施例,本申请还提供一种计算设备,该计算设备具有如图1至5所示的主板。在具体应用中,该计算设备可以为前述服务器,也可以为向企业或服务提供商核心网络提供入口点的包括主板的边缘设备(edge device),例如但不限于,路由器、路由交换机、IAD(综合接入设备,Integrated Access Device)、多路复用器,以及各种城域网(MAN)和广域网(WAN)接入设备。此外,计算设备也可以为个人电脑(personal computer,PC)。
本申请还提供一种基板管理控制器,包括处理器和存储器,存储器中存储程序代码,基板管理控制器运行时,使得处理器执行所述程序代码实现如图8至图11中任一所述方法中基板管理控制器所执行方法的操作步骤的功能,为了简洁,在此不再赘述。
本申请实施例提供的计算设备,具有本申请实施例提供的主板的有益效果,具体可以参考上述实施例对于主板的具体说明,本申请实施例在此不再赘述。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘(solid state drive,SSD)。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
Claims (18)
1.一种主板,其特征在于,包括:
基础板,用于设置基础器件和第一外部接口,所述基础器件包括提供通用计算能力的最小系统所包括的器件;所述基础板通过所述第一外部接口与扩展板的第二外部接口耦合;
所述扩展板,用于扩展所述基础板的功能,所述扩展板包括所述第二外部接口。
2.根据权利要求1所述的主板,其特征在于,所述计算设备还包括扩展器件,用于扩展所述基础板的功能的器件,所述扩展器件包括功能组件,所述功能组件包括IO组件、存储组件、加速组件和内存扩展组件中至少一种,其中,所述IO组件,用于实现所述计算设备与所述计算设备外部的器件或设备的通信,以及扩展所述计算设备的IO能力;所述存储组件,用于扩展所述计算设备的存储能力;所述加速组件,用于提供系统加速部件扩展和互连功能;所述内存扩展组件,用于提供系统扩展内存带宽、内存容量的功能。
3.根据权利要求1或2所述的主板,其特征在于,所述第一外部接口包括管理接口和数据接口,其中,所述管理接口,用于实现所述基础板与所述扩展板之间传输控制信号;所述数据接口,用于实现所述基础器件与所述扩展器件之间的数据传输。
4.根据权利要求3所述的主板,其特征在于,所述数据接口包括支持快捷外围部件互连标准PCIe、计算快速链接CXL、融合总线UB、华为缓存一致性系统HCCS、串行连接小型计算机系统SAS以及串行高级技术附件SATA功能的接口中的至少一种。
5.根据权利要求3所述的主板,其特征在于,所述扩展器件与所述数据接口连接,实现所述基础器件与所述扩展器件之间的数据传输。
6.根据权利要求3所述的主板,其特征在于,所述扩展器件设置于所述扩展板,所述扩展板与所述数据接口连接,实现所述基础器件与所述扩展器件之间的数据传输。
7.根据权利要求3所述的主板,其特征在于,所述第一外部接口还包括第一供电接口,其中,所述第一供电接口,用于根据所述基础器件和/或所述扩展器件的供电需求供电。
8.根据权利要求7所述的主板,其特征在于,所述第一供电接口通过线缆与供电组件相连。
9.根据权利要求1至8中任一项所述的主板,其特征在于,所述基础板配置为具有多个板体尺寸,所述多个板体尺寸中一个板体尺寸根据所述处理器的配置数量和/或所述内存的配置数量设置。
10.根据权利要求9所述的主板,其特征在于,所述基础板上开设有安装孔,所述安装孔与所述计算设备的机框上固定结构相适配。
11.根据权利要求10所述的主板,其特征在于,所述固定结构按位置关系被划分为至少一组固定结构,所述至少一组固定结构中一组固定结构可适配不同板体尺寸的基础板。
12.根据权利要求1所述的主板,其特征在于,所述第二外部接口包括第二供电接口,当所述扩展板的供电需求小于第一阈值的器件时,所述第二供电接口用于与所述第一供电接口采用板间转接供电方式相连,对所述扩展板中器件供电。
13.根据权利要求1所述的主板,其特征在于,所述第二外部接口包括第二供电接口,当所述扩展板包括供电需求大于或等于第二阈值的器件时,所述第二供电接口通过线缆与供电组件直接相连,以采用线缆直连供电方式对所述扩展板中器件供电。
14.根据权利要求1至13中任一项所述的主板,其特征在于,所述扩展板上设置基板管理控制器。
15.根据权利要求1至14中任一项所述的主板,其特征在于,所述基础板上设置基板管理控制器。
16.根据权利要求15所述的主板,其特征在于,所述基板管理控制器设置为基板管理控制卡,所述基板管理控制卡与所述扩展板通过插槽连接。
17.根据权利要求14至17中任一项所述的主板,其特征在于,所述基板管理控制器预设有管理对象模板,所述功能组件中预设有与所述管理对象模板对应的硬件自描述信息;
所述基板管理控制器,用于获取所述功能组件的所述硬件自描述信息,并根据所述管理对象模板和所述硬件自描述信息生成管理对像实例,通过所述管理对像实例识别并对所述功能组件实现监控管理,所述监控管理包括温度控制和合法性校验中至少一种。
18.一种计算设备,其特征在于,所述计算设备包括主板,所述主板采用权利要求1至17中任意一项所述主板,以实现其相应的功能或连接关系。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP22857763.1A EP4361759A1 (en) | 2021-08-20 | 2022-08-16 | Motherboard and computing device |
PCT/CN2022/112634 WO2023020451A1 (zh) | 2021-08-20 | 2022-08-16 | 一种主板及计算设备 |
US18/427,724 US20240220439A1 (en) | 2021-08-20 | 2024-01-30 | Motherboard and computing device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021109616485 | 2021-08-20 | ||
CN202110961648 | 2021-08-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115708040A true CN115708040A (zh) | 2023-02-21 |
Family
ID=85212881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111638881.6A Pending CN115708040A (zh) | 2021-08-20 | 2021-12-29 | 一种主板及计算设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240220439A1 (zh) |
EP (1) | EP4361759A1 (zh) |
CN (1) | CN115708040A (zh) |
WO (1) | WO2023020451A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023160690A1 (zh) * | 2022-02-28 | 2023-08-31 | 华为技术有限公司 | 基础板、主板及计算设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117520251A (zh) * | 2024-01-05 | 2024-02-06 | 紫光恒越技术有限公司 | 一种双处理器架构的计算机主板和计算机设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201845275U (zh) * | 2010-11-11 | 2011-05-25 | 深圳市信步科技有限公司 | 一种具有扩展功能的主板 |
CN206003169U (zh) * | 2016-08-03 | 2017-03-08 | 宝晟科技(北京)有限公司 | 一种方便升级的etc主控板 |
CN107463224B (zh) * | 2017-08-28 | 2021-01-29 | 北京嘉楠捷思信息技术有限公司 | 显卡扩展板及应用其的主机、计算设备 |
CN208848149U (zh) * | 2018-11-15 | 2019-05-10 | 山东浪潮人工智能研究院有限公司 | 一种车载计算单元主板结构 |
US11341809B2 (en) * | 2019-06-26 | 2022-05-24 | Aristocrat Technologies Australia Pty Limited | Gaming machines having retrofittable insertable memory expansion board with onboard random number generator |
-
2021
- 2021-12-29 CN CN202111638881.6A patent/CN115708040A/zh active Pending
-
2022
- 2022-08-16 EP EP22857763.1A patent/EP4361759A1/en active Pending
- 2022-08-16 WO PCT/CN2022/112634 patent/WO2023020451A1/zh active Application Filing
-
2024
- 2024-01-30 US US18/427,724 patent/US20240220439A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023160690A1 (zh) * | 2022-02-28 | 2023-08-31 | 华为技术有限公司 | 基础板、主板及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
EP4361759A1 (en) | 2024-05-01 |
US20240220439A1 (en) | 2024-07-04 |
WO2023020451A1 (zh) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107526665B (zh) | 机箱管理系统及机箱管理方法 | |
CN102129274B (zh) | 服务器、服务器组件及控制风扇转速方法 | |
TWI531907B (zh) | 基板管理系統架構 | |
WO2023020451A1 (zh) | 一种主板及计算设备 | |
US7069349B2 (en) | IPMI dual-domain controller | |
CN101350737B (zh) | 智能平台管理界面系统、电子设备及存储器分享方法 | |
US8732285B2 (en) | Upgradeable persistent virtual storage | |
CN100541444C (zh) | 多主板系统之管理系统 | |
US20090031051A1 (en) | Centralized server rack management using usb | |
US20120030492A1 (en) | Server system | |
MX2014001056A (es) | Método y sistema para construir un sistema informatico de baja potencia. | |
US20060277401A1 (en) | System and method for information handling system interoperable firmware storage | |
KR20060047693A (ko) | 스카시 및 사스 하드웨어 검증시스템 및 방법 | |
CN111209241A (zh) | 整机柜服务器的管理系统 | |
CN112698871A (zh) | 在多cpu设备中使用option-rom的网络适配器配置 | |
TWI791913B (zh) | 經由邊帶介面恢復場域可程式閘陣列韌體之系統及方法 | |
CN109117418A (zh) | 一种可编程片上系统 | |
CN116702149A (zh) | 一种可信度量方法、服务器以及芯片 | |
US10489328B2 (en) | Universal sleds server architecture | |
CN217846999U (zh) | 一种主板和计算设备 | |
WO2023160699A1 (zh) | 一种单板管理系统、方法、装置及设备 | |
US10409940B1 (en) | System and method to proxy networking statistics for FPGA cards | |
US10817397B2 (en) | Dynamic device detection and enhanced device management | |
Geng | Design of Energy‐Efficient IT Equipment | |
US20230024970A1 (en) | Universal warranty exchange protocol for unsupported technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |