CN117369612B - 一种服务器硬件管理系统及方法 - Google Patents

一种服务器硬件管理系统及方法 Download PDF

Info

Publication number
CN117369612B
CN117369612B CN202311680312.7A CN202311680312A CN117369612B CN 117369612 B CN117369612 B CN 117369612B CN 202311680312 A CN202311680312 A CN 202311680312A CN 117369612 B CN117369612 B CN 117369612B
Authority
CN
China
Prior art keywords
signal
dpu
ipu
server
bmc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311680312.7A
Other languages
English (en)
Other versions
CN117369612A (zh
Inventor
郭利文
邹见效
李英
张超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202311680312.7A priority Critical patent/CN117369612B/zh
Publication of CN117369612A publication Critical patent/CN117369612A/zh
Application granted granted Critical
Publication of CN117369612B publication Critical patent/CN117369612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

一种服务器硬件管理系统及方法,属于服务器领域。本发明把PWRBRK#信号从单向变为双向。当IPU/DPU板卡运行时,监测到板级电源状态异常或者热管理异常,需要主机进入电源管理和热管理状态时,IPU/DPU板卡即可主动快速拉低PWRBRK#信号,服务器收到该信号时,通过BMC读取IPU/DPU板卡的状态信息,确认异常类型,并进行相应的电源管理或是热管理。反之,如果主机需要对IPU/DPU板卡进行电源管理和热管理时,依旧可以通过轮询机制向IPU/DPU板卡发送PWRBRK#信号进行管理。本发明无需修改硬件电路,实现服务器对电源管理及热管理的快速响应。

Description

一种服务器硬件管理系统及方法
技术领域
本发明属于服务器领域,尤其涉及一种服务器硬件管理系统及方法。
背景技术
根据PCIe CEM的定义,传统服务器架构中,CPU充当PCIe RP(Root Point,根节点)的角色。CPU通过PCIe总线与传统的板卡进行信号传输和数据交换,通过对PWRBRK#信号的使能或失效来使板卡进入或退出Emergency Power Reduction(紧急功率消减)状态。PWRBRK#是一个单向控制信号,PCIe板卡的电源管理和热管理状态不能及时反馈给CPU,只能通过CPU的主动轮询来获取,不能及时反馈板卡的状态。新一代服务器和云计算硬件架构采用IPU(Infrastructure Processing Unit,基础设施处理器)/DPU(Data ProcessingUnit,数据处理器)板卡实现网络、存储、安全、基础架构等不同应用的卸载加速,IPU/DPU是必不可少的一环。在此架构上,IPU/DPU既可以是PCIe EP(End Point,端节点),也可以PCIeRP,因此IPU/DPU需要对板卡自身的软硬件管理以及对所在的主机服务器进行管理。
发明内容
本发明目的在于提供一种服务器硬件管理系统及方法,以解决服务器硬件管理不及时的技术问题。
为解决上述技术问题,本发明提出的一种服务器硬件管理系统及方法的具体技术方案如下:
本发明提供的服务器硬件管理系统,该系统的IPU/DPU板卡包括BMC、FPGA及SoC,服务器包括主板、FAN及PSU;其中服务器主板包括BMC、MEM及CPU;其中,IPU为基础设施处理器、DPU为数据处理器、BMC为基板管理控制器、FPGA为现场可编程门阵列、SoC为系统级芯片、MEM为内存、PSU为电源、FAN为风扇。IPU/DPU板卡通过金手指插入服务器的PCIE插槽,PWRBRK#为双向信号,IPU/DPU板卡的BMC与服务器主板的BMC通过PWRBRK#信号双向传输;IPU/DPU板卡上的BMC与FPGA之间传输FPGA_PROC#信号,FPGA_PROC#信号为IPU/DPU板卡的BMC要求FPGA进入Throttle状态的使能信号,Throttle状态为遏制状态;IPU/DPU板卡上的BMC与SoC之间传输SOC_PROC#信号,SOC_PROC#信号为IPU/DPU板卡的BMC要求SoC进入Throttle状态的使能信号;服务器主板的BMC与CPU之间传输PROC#信号,服务器主板的BMC与MEM之间传输PROC#信号,PROC#信号为服务器主板的BMC要求CPU及MEM进入Throttle状态的使能信号;服务器主板的BMC传输Throttle信号至PSU,Throttle信号为服务器主板的BMC要求PSU进入电源输出调整状态的使能信号;服务器主板的BMC与FAN之间传输PWM及TACH#信号,PWM及TACH#信号为服务器主板的BMC根据散热策略进行风扇输出调整的信号,其中PWM信号由服务器主板的BMC发送给FAN,通过频率来调整风扇转速;TACH#由FAN发送给服务器主板的BMC,表示风扇实时的转速。服务器主板的BMC通过对比预定的风扇转速和TACH#信号反馈的实际转速来动态调整PWM信号。
本发明在遵守PCIe CEM定义的基础上,把PWRBRK#信号从单向变为双向实现IPU/DPU板卡对服务器的电源管理控制和热管理功能。当IPU/DPU板卡运行时,监测到板级电源状态异常或者热管理异常,需要主机进入电源管理和热管理状态时,IPU/DPU板卡即可主动快速拉低PWRBRK#信号,服务器收到该信号时,通过BMC读取IPU/DPU板卡的状态信息,确认异常类型,并进行相应的电源管理或是热管理。反之,如果主机需要对IPU/DPU板卡进行电源管理和热管理时,依旧可以通过轮询机制向IPU/DPU板卡发送PWRBRK#信号进行管理。
本发明的一种服务器硬件管理系统及方法具有以下优点:
1、在遵循PCIe CEM的定义前提下,确保PCIe连接器的信号定义和管脚不变,从而无需修改硬件线路,无需增加硬件成本和设计成本。
2、在遵循PCIe CEM的定义前提下,丰富PWRBRK#信号的内涵,通过把传统的单向PWRBRK#信号改为双向信号,可以有效实现板卡电源和热的主动管理,实现定制化的电源和散热需求。
3、在有IPU/DPU板卡的系统中,通过PWRBRK#信号的带外硬件信号,服务器可以快速中断BMC/CPU的处理事务,配合IPU/DPU板卡内的BMC控制器,可以优先实现对服务器和系统的管理。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明服务器硬件功能模块示意图。
图2为本发明的IPU/DPU硬件管理方法流程图。
图3为本发明服务器硬件管理方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据PCIe CEM规范的定义,PWRBRK#信号是一个可选的用于实现Emergency PowerReduction状态的信号,Emergency Power Reduction状态为紧急功率消减状态,PWRBRK#信号是一个单向的异步控制信号,通常由PCIe RP来控制。因此可以采用多主机方式控制该信号。基于此特性,本发明改进PWRBRK#信号的定义,依旧采用OD门,同时把该单向信号转为双向信号,并在兼容PCIe PWRBRK#信号的基础上,丰富其功能。
图1为本发明服务器硬件功能模块示意图,如图1所示,该系统的IPU/DPU板卡包括BMC、FPGA及SoC,服务器包括主板、FAN及PSU;其中服务器主板包括BMC、MEM及CPU;其中,IPU为基础设施处理器、DPU为数据处理器、BMC为基板管理控制器、FPGA为现场可编程门阵列、SoC为系统级芯片、MEM为内存、PSU为电源、FAN为风扇。IPU/DPU板卡通过金手指插入服务器的PCIE插槽,PWRBRK#为双向信号,IPU/DPU板卡的BMC与服务器主板的BMC通过PWRBRK#信号双向传输;IPU/DPU板卡上的BMC与FPGA之间传输FPGA_PROC#信号,FPGA_PROC#信号为IPU/DPU板卡的BMC要求FPGA进入Throttle状态的使能信号,Throttle状态为遏制状态;IPU/DPU板卡上的BMC与SoC之间传输SOC_PROC#信号,SOC_PROC#信号为IPU/DPU板卡的BMC要求SoC进入Throttle状态的使能信号;服务器主板的BMC与CPU之间传输PROC#信号,服务器主板的BMC与MEM之间传输PROC#信号,PROC#信号为服务器主板的BMC要求CPU及MEM进入Throttle状态的使能信号;服务器主板的BMC传输Throttle信号至PSU,Throttle信号为服务器主板的BMC要求PSU进入电源输出调整状态的使能信号;服务器主板的BMC与FAN之间传输PWM及TACH#信号,PWM及TACH#信号为服务器主板的BMC根据散热策略进行风扇输出调整的信号,其中PWM信号由服务器主板的BMC发送给FAN,通过频率来调整风扇转速;TACH#由FAN发送给服务器主板的BMC,表示风扇实时的转速。服务器主板的BMC通过对比预定的风扇转速和TACH#信号反馈的实际转速来动态调整PWM信号。
当服务器需要IPU/DPU板卡降低功耗以达到节能的目的时,就发送PWRBRK#信号给IPU/DPU板卡,IPU/DPU板卡上的BMC收到PWRBRK#信号之后,发送FPGA_PROC#信号至IPU/DPU板卡上的FPGA并且发送SoC_PROC#信号至IPU/DPU板卡上的SoC,使FPGA及SoC自动进入Throttle状态,从而使IPU/DPU板卡快速进入Emergency Power Reduction状态,以满足服务器的整体功耗策略,这就兼容了传统PCIe CEM对PWRBRK#的定义。
另外,IPU/DPU板卡上的FPGA/SoC/BMC实时监控自身和服务器的工作状态,及时发现异常状态。一旦发现电源管理异常或者热管理异常,就发送PWRBRK#信号给服务器,服务器主板的BMC收到PWRBRK#信号后,快速拉低PROC#信号,使CPU/MEN快速进入Throttle状态,同时通过系统管理总线SMBus或者PCIe来读取IPU/DPU板卡相应的状态信息,确认异常状态类型。如果是IPU/DPU板卡温度过高,则快速读取并及时调取服务器的散热策略,如果是整体功耗过高,则强迫服务器主板的CPU降频等,直到恢复正常为止。
由于目前无法改变传统CPU对PWRBRK#信号的输入输出定义(目前仅为单向OD),因此,在服务器端PWRBRK#信号接入BMC,通过BMC来实现IPU/DPU板卡对主机的监控管理。由于服务器端的BMC通过会针对高级配置和电源管理接口ACPI进行管理,所以该信号一般都连接至BMC,因此无需修改服务器主板端线路。
图2为本发明的IPU/DPU硬件管理方法流程图,包括如下步骤:
步骤S11:IPU/DPU板卡监测电源工作状态和热管理状态,若监测到板级电源状态异常或者热管理异常,则执行步骤S12;若未监测到异常则继续监测;
步骤S12:IPU/DPU板卡记录异常状态并拉低PWRBRK#信号;
步骤S13:检测异常状态是否持续存在,若持续存在则继续执行步骤S12;若不存在则释放PWRBRK#信号,IPU/DPU板卡恢复正常工作。
图3为本发明服务器硬件管理方法流程图,包括如下步骤:
步骤S21:服务器监测系统整体运转是否正常,若运转异常则执行步骤S22;若运转正常则继续监测;
步骤S22:检测是否接收到IPU/DPU板卡的PWRBRK#信号;若接收到PWRBRK#信号,则执行步骤S23;若未接收到PWRBRK#信号,则执行步骤S27;
步骤S23:服务器主板的BMC读取IPU/DPU板卡状态信息,判断是功耗问题还是过热问题,若是功耗问题则执行步骤S24;若是过热问题则执行步骤S25;
步骤S24:根据具体的功耗调整策略调整电源输出,或者通过降频、调整CPU的工作状态,发送PROC#信号至CPU及MEM,使CPU及MEM进入Throttle状态;
步骤S25:根据服务器的具体散热表,调整散热策略,如调整风扇模组的转速等;
步骤S26:检测PWRBRK#信号是否失效,若一直有效则继续执行步骤S23;若失效则执行步骤S21;
步骤S27:检查服务器的各个部件是否处于正常工作状态,若正常则继续执行步骤S27;若异常则执行步骤S28;
步骤S28:检查IPU/DPU板卡是否工作异常,若工作正常则执行步骤S29;若工作异常则执行步骤S30;
步骤S29:继续检查服务器其他部件并针对其他异常部件进行处理;
步骤S30:使能PWRBRK#信号,强迫IPU/DPU板卡进入Emergency Power Reduction状态;
步骤S31:检查系统是否正常工作,若正常工作执行步骤S32;若未正常工作继续执行步骤S30;
步骤S32:释放PWRBRK#信号,系统恢复正常工作。
本发明遵循PCIe CEM的定义,在确保PCIe连接器的信号定义和管脚不变,无需修改硬件线路,无需增加硬件成本和设计成本的前提下,将PWRBRK#信号由单向传输转为双向传输,丰富PWRBRK#信号的内涵,提高服务器的硬件管理效率,有效实现板卡电源和热的主动管理,实现定制化的电源和散热需求。服务器在原有通过轮询的方式实现硬件管理的基本上,增加了IPU/DPU板卡通过检测发送PWRBRK#信号至服务器,通过该PWRBRK#信号的带外硬件信号,可以快速中断服务器BMC/CPU的处理事务,配合IPU/DPU板卡内的BMC控制器,可以优先实现对服务器和系统的管理,服务器可以及时感知IPU/DPU板卡状态信息,提高硬件管理的及时性。
可以理解,本发明是通过一些实施例进行描述的,本领域技术人员知悉的,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明所保护的范围内。

Claims (3)

1.一种服务器硬件管理系统,所述系统的IPU/DPU板卡包括BMC、FPGA及SoC,服务器包括主板、FAN及PSU;其中服务器主板包括BMC、MEM及CPU;其中,IPU为基础设施处理器、DPU为数据处理器、BMC为基板管理控制器、FPGA为现场可编程门阵列、SoC为系统级芯片、MEM为内存、PSU为电源、FAN为风扇;IPU/DPU板卡通过金手指插入服务器的PCIE插槽;其特征在于,PWRBRK#为双向信号,IPU/DPU板卡的BMC与服务器主板的BMC通过PWRBRK#信号双向传输;当服务器需要IPU/DPU板卡降低功耗以达到节能的目的时,就发送PWRBRK#信号给IPU/DPU板卡;IPU/DPU板卡上的FPGA/SoC/BMC 实时监控自身和服务器的工作状态,及时发现异常状态;一旦发现电源管理异常或者热管理异常,就发送PWRBRK#信号给服务器;IPU/DPU板卡上的BMC与FPGA之间传输FPGA_PROC#信号,FPGA_PROC#信号为IPU/DPU板卡的BMC要求FPGA进入Throttle状态的使能信号,Throttle状态为遏制状态;IPU/DPU板卡上的BMC与SoC之间传输SOC_PROC#信号,SOC_PROC#信号为IPU/DPU板卡的BMC要求SoC进入Throttle状态的使能信号;服务器主板的BMC与CPU之间传输PROC#信号,服务器主板的BMC与MEM之间传输PROC#信号,PROC#信号为服务器主板的BMC要求CPU及MEM进入Throttle状态的使能信号;服务器主板的BMC传输Throttle信号至PSU,Throttle信号为服务器主板的BMC要求PSU进入电源输出调整状态的使能信号;服务器主板的BMC与FAN之间传输PWM及TACH#信号,PWM及TACH#信号为服务器主板的BMC根据散热策略进行风扇输出调整的信号,其中PWM信号由服务器主板的BMC发送给FAN,通过频率来调整风扇转速;TACH#由FAN发送给服务器主板的BMC,表示风扇实时的转速;服务器主板的BMC通过对比预定的风扇转速和TACH#信号反馈的实际转速来动态调整PWM信号。
2.一种基于权利要求1所述的服务器硬件管理系统的服务器硬件管理方法,应用于IPU/DPU板卡,其特征在于,包括如下步骤:
步骤S11:IPU/DPU板卡监测电源工作状态和热管理状态,若监测到板级电源状态异常或者热管理异常,则执行步骤S12;若未监测到异常则继续监测;
步骤S12:IPU/DPU板卡记录异常状态并拉低PWRBRK#信号;
步骤S13:检测异常状态是否持续存在,若持续存在则继续执行步骤S12;若不存在则释放PWRBRK#信号,IPU/DPU板卡恢复正常工作。
3.一种基于权利要求1所述的服务器硬件管理系统的服务器硬件管理方法,应用于服务器,其特征在于,包括如下步骤:
步骤S21:服务器监测系统整体运转是否正常,若运转异常则执行步骤S22;若运转正常则继续监测;
步骤S22:检测是否接收到IPU/DPU板卡的PWRBRK#信号;若接收到PWRBRK#信号,则执行步骤S23;若未接收到PWRBRK#信号,则执行步骤S27;
步骤S23:服务器主板的BMC读取IPU/DPU板卡状态信息,判断是功耗问题还是过热问题,若是功耗问题则执行步骤S24;若是过热问题则执行步骤S25;
步骤S24:根据具体的功耗调整策略调整电源输出,或者通过降频、调整CPU的工作状态,发送PROC#信号至CPU及MEM使CPU及MEM进入Throttle状态;
步骤S25:根据服务器的具体散热表,调整散热策略;
步骤S26:检测PWRBRK#信号是否失效,若一直有效则继续执行步骤S23;若失效则执行步骤S21;
步骤S27:检查服务器的各个部件是否处于正常工作状态,若正常则继续执行步骤S27;若异常则执行步骤S28;
步骤S28:检查IPU/DPU板卡是否工作异常,若工作正常则执行步骤S29;若工作异常则执行步骤S30;
步骤S29:继续检查服务器其他部件并针对其他异常部件进行处理;
步骤S30:使能PWRBRK#信号,强迫IPU/DPU板卡进入Emergency Power Reduction状态;
步骤S31:检查系统是否正常工作,若正常工作执行步骤S32;若未正常工作继续执行步骤S30;
步骤S32:释放PWRBRK#信号,系统恢复正常工作。
CN202311680312.7A 2023-12-08 2023-12-08 一种服务器硬件管理系统及方法 Active CN117369612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311680312.7A CN117369612B (zh) 2023-12-08 2023-12-08 一种服务器硬件管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311680312.7A CN117369612B (zh) 2023-12-08 2023-12-08 一种服务器硬件管理系统及方法

Publications (2)

Publication Number Publication Date
CN117369612A CN117369612A (zh) 2024-01-09
CN117369612B true CN117369612B (zh) 2024-02-13

Family

ID=89398869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311680312.7A Active CN117369612B (zh) 2023-12-08 2023-12-08 一种服务器硬件管理系统及方法

Country Status (1)

Country Link
CN (1) CN117369612B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908583A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种服务器用功耗管理板
US10585816B1 (en) * 2018-12-07 2020-03-10 Dell Products, L.P. System and method for serial communication at a peripheral interface device
CN111427744A (zh) * 2020-03-13 2020-07-17 苏州浪潮智能科技有限公司 一种服务器的功耗管理方法、设备以及介质
CN113672539A (zh) * 2020-05-15 2021-11-19 英特尔公司 通过接口的现有辅助引脚的边带信号传输
US11604756B1 (en) * 2021-10-15 2023-03-14 Dell Products, L.P. High-speed, out-of-band (OOB) management links for inter-baseboard management controller (BMC) communications in high performance computing (HPC) platforms
CN115809167A (zh) * 2021-09-15 2023-03-17 英业达科技有限公司 快速周边组件互连接口的自我测试系统及其方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475009B (zh) * 2020-04-16 2022-03-22 苏州浪潮智能科技有限公司 一种服务器内gpu的降功耗电路及服务器
KR102570943B1 (ko) * 2021-04-13 2023-08-28 에스케이하이닉스 주식회사 PCIe 디바이스 및 그 동작 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908583A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种服务器用功耗管理板
US10585816B1 (en) * 2018-12-07 2020-03-10 Dell Products, L.P. System and method for serial communication at a peripheral interface device
CN111427744A (zh) * 2020-03-13 2020-07-17 苏州浪潮智能科技有限公司 一种服务器的功耗管理方法、设备以及介质
CN113672539A (zh) * 2020-05-15 2021-11-19 英特尔公司 通过接口的现有辅助引脚的边带信号传输
CN115809167A (zh) * 2021-09-15 2023-03-17 英业达科技有限公司 快速周边组件互连接口的自我测试系统及其方法
US11604756B1 (en) * 2021-10-15 2023-03-14 Dell Products, L.P. High-speed, out-of-band (OOB) management links for inter-baseboard management controller (BMC) communications in high performance computing (HPC) platforms

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A New Approach to Mitigate PCI Express Gen4 Crosstalk from Sideband Signals in Connectors;Yaping Zhou等;《2017 IEEE 26th Conference on Electrical Performance of Electronic Packaging and Systems(EPEPS)》;1-3 *
PCIE卡的主要引脚及热插拔;全站程序员站长;《https://cloud.tencent.com/developer/article/2080258》;1-8 *

Also Published As

Publication number Publication date
CN117369612A (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
JP4404887B2 (ja) 動的レーン管理システム及び方法
US20080281475A1 (en) Fan control scheme
US8458499B2 (en) Method for reducing power state in a computer system out-of-band when a request for reducing the power state is not immediately serviceable in band according to a priority of the request
US7596638B2 (en) Method, system, and apparatus to decrease CPU temperature through I/O bus throttling
US20030088799A1 (en) Method and apparatus for regulation of electrical component temperature and power consumption rate through bus width reconfiguration
US8250393B2 (en) Power management method and related chipset and computer system
WO2022057464A1 (zh) 一种灵活配置的多计算节点服务器主板结构和程序
CN110399034B (zh) 一种SoC系统的功耗优化方法及终端
KR101916985B1 (ko) 두 개의 집적 회로 간의 트랜잭션 교환을 제어하는 방법
CN106371540B (zh) 系统电源管理方法、芯片及电子设备
CN101251834B (zh) 主总线参数调整方法、计算机系统
CN111722686B (zh) 一种跨节点的带内散热控制方法和装置
CN107908583B (zh) 一种服务器用功耗管理板
CN116755542B (zh) 一种整机功耗降低方法、系统、基板管理控制器及服务器
CN109408312A (zh) 一种服务器运行温度测试系统及设备
CN117369612B (zh) 一种服务器硬件管理系统及方法
CN111324503A (zh) 机框管理装置、方法和计算机可读存储介质
CN111190468B (zh) 一种ocp网卡散热装置及方法
CN111338907A (zh) 一种pcie设备的远程状态监测系统及方法
TW202217570A (zh) 溫度管理系統
JP4860255B2 (ja) スロットリング制御方法、スロットリング制御システム
CN116303213B (zh) 一种提高bmc芯片计算效率的系统及方法
TWI830573B (zh) 基板管理控制裝置及其控制方法
CN114489300B (zh) 一种Expander芯片复位方法和装置
US20030176985A1 (en) Thermal control method for computers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant