WO2021208360A1

WO2021208360A1 - 一种服务器内gpu的降功耗电路及服务器

Info

Publication number: WO2021208360A1
Application number: PCT/CN2020/117277
Authority: WO
Inventors: 王鹏; 程世超; 孙珑玲; 刘闻禹; 叶明洋
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2020-04-16
Filing date: 2020-09-24
Publication date: 2021-10-21
Also published as: US11656674B2; US20230035371A1; CN111475009B; CN111475009A

Abstract

一种服务器内GPU的降功耗电路及一种服务器，该降功耗电路包括降频控制芯片。降频控制芯片在接收到PSU生成的过功率告警信号后，生成降频控制信号至各GPU的PWRBRK引脚，以开启各GPU的降频操作。可见，本申请直接采用底层硬件线路实现，无需操作系统介入，响应速度较快，使得GPU的整个降频操作可在5ms内完成，PSU在此较短时间内不会触发过功率保护，从而避免了服务器异常掉电造成用户的业务数据丢失的情况发生。

Description

一种服务器内GPU的降功耗电路及服务器

本申请要求于2020年4月16日提交中国专利局、申请号为202010300844.3、发明名称为“一种服务器内GPU的降功耗电路及服务器”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及服务器领域，特别是涉及一种服务器内GPU的降功耗电路及服务器。

背景技术

随着大数据、物联网等技术的应用，数据在近几年呈指数型增长，导致仅由CPU作为数据处理核心的传统服务器无法满足数据处理需求，搭载GPU(Graphics Processing Unit，图形处理器)的服务器应运而生。目前，随着GPU的计算能力不断提升，其功耗也随之升高，再加上服务器内CPU、内存、硬盘等硬件的存在，服务器的整机功耗将会超过为服务器供电的PSU(Power Supply Unit，供电模块)所能支持的上限。

现有技术中，服务器通常采用Power capping(功率封顶)方法限制服务器的整机功耗，以使服务器的整机功耗小于PSU所能支持的上限。具体地，Power capping方法为：提前为服务器设置一个总功耗阈值，在服务器运行的过程中，监控服务器的整机功耗是否超过所设的总功耗阈值，若是，则启动降功耗策略，即通过PCIE(peripheral component interconnect express，外围元件快速互联)总线向服务器内GPU下发降频指令，以使GPU在接收到降频指令后对自身运行频率进行限制。但是，Power capping方法在操作系统层面完成，存在较长时间的延时(大约在50ms左右)，在此段时间内，PSU很有可能已经因超功率输出触发过功率保护(PSU超功率输出一段时间后会触发过功率保护)，这将会导致服务器异常掉电，从而造成用户的业务数据丢失。

因此，如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。

发明内容

本发明的目的是提供一种服务器内GPU的降功耗电路及服务器，直接采用底层硬件线路实现，无需操作系统介入，响应速度较快，使得GPU的整个降频操作可在5ms内完成，PSU在此较短时间内不会触发过功率保护，从而避免了服务器异常掉电造成用户的业务数据丢失的情况发生。

为解决上述技术问题，本发明提供了一种服务器内GPU的降功耗电路，包括：

分别与服务器内的PSU和所述服务器内各GPU的PWRBRK引脚连接的降频控制芯片，用于在接收到所述PSU生成的过功率告警信号后，生成降频控制信号至各所述GPU的PWRBRK引脚，以开启各所述GPU的降频操作。

优选地，所述降功耗电路还包括：

分别与所述降频控制芯片的输出端和各所述GPU的PWRBRK引脚连接的开关芯片；

与所述开关芯片的通道控制端子连接的控制电路，用于根据所述服务器的整机功耗与所述PSU的额定功率的对比关系，从各所述GPU中确定需降频处理的目标GPU，并控制所述开关芯片将所述降频控制芯片和所述目标GPU之间的传输通道打开，以使所述降频控制信号输出至所述目标GPU的PWRBRK引脚，开启所述目标GPU的降频操作。

优选地，所述控制电路包括：

与所述开关芯片的通道控制端子连接的I/O扩展芯片；

与所述I/O扩展芯片连接的控制器，用于根据所述服务器的整机功耗与所述PSU的额定功率的对比关系，从各所述GPU中确定需降频处理的目标GPU，并通过所述I/O扩展芯片控制所述开关芯片将所述降频控制芯片和所述目标GPU之间的传输通道打开，以使所述降频控制信号输出至所述目标GPU的PWRBRK引脚。

优选地，所述控制器具体用于：

当P2+m×P3>P1时，将所述服务器中需降频处理的目标GPU的数量n从n＝1开始遍历，确定第一个满足关系式P2+P3/N×n+(m-n)×P3≤P1≤P2+P3/N×(n-1)+(m-n+1)×P3的整数k；其中，P1为所述PSU的额定功率，P2为所述服务器整机中除GPU外的其他部件总功耗，P3为单个GPU的功耗，m为所述服务器整机中GPU的总数量，N为预设参数；

当k≤m时，通过所述I/O扩展芯片控制所述开关芯片打开所述降频控制芯片和k个GPU之间的传输通道，以使所述降频控制信号输出至k个所述GPU的PWRBRK引脚；

当k>m时，通过所述I/O扩展芯片控制所述开关芯片打开所述降频控制芯片和m个GPU之间的传输通道，以使所述降频控制信号输出至m个所述GPU的PWRBRK引脚。

优选地，所述控制器通过PMBus总线与所述PSU连接；

且所述控制器还用于当k≤m时，降低所述PSU的过功率阈值。

优选地，所述控制器具体用于当k≤m时，根据过功率阈值P＝P2+P3/N×k+(m-k)×P3修改所述PSU的过功率阈值，以降低所述PSU的过功率阈值。

优选地，所述控制器还用于当k>m时，进行表征所述服务器在降频后的整机功耗仍超过所述PSU的额定功率的告警。

优选地，所述降频控制芯片具体为所述服务器内的CPLD，所述控制器具体为所述服务器内的BMC。

为解决上述技术问题，本发明还提供了一种服务器，包括PSU和GPU，还包括上述任一种服务器内GPU的降功耗电路。

优选地，所述PSU具体为PSU 1+1冗余架构。

本发明提供了一种服务器内GPU的降功耗电路，包括降频控制芯片。降频控制芯片在接收到PSU生成的过功率告警信号后，生成降频控制信号至各GPU的PWRBRK引脚，以开启各GPU的降频操作。可见，本申请直接采用底层硬件线路实现，无需操作系统介入，响应速度较快，使得GPU的整个降频操作可在5ms内完成，PSU在此较短时间内不会触发过功率保护，从而避免了服务器异常掉电造成用户的业务数据丢失的情况发生。

本发明还提供了一种服务器，与上述降功耗电路具有相同的有益效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种服务器内GPU的降功耗电路的结构示意图；

图2为本发明实施例提供的一种服务器内GPU的降功耗电路的具体结构示意图；

图3为本发明实施例提供的一种服务器内GPU的降功耗电路的具体器件示意图。

具体实施方式

本发明的核心是提供一种服务器内GPU的降功耗电路及服务器，直接采用底层硬件线路实现，无需操作系统介入，响应速度较快，使得GPU的整个降频操作可在5ms内完成，PSU在此较短时间内不会触发过功率保护，从而避免了服务器异常掉电造成用户的业务数据丢失的情况发生。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参照图1，图1为本发明实施例提供的一种服务器内GPU的降功耗电路的结构示意图。

该服务器内GPU的降功耗电路包括：

分别与服务器内的PSU和服务器内各GPU的PWRBRK引脚连接的降频控制芯片1，用于在接收到PSU生成的过功率告警信号后，生成降频控制信号至各GPU的PWRBRK引脚，以开启各GPU的降频操作。

具体地，本申请的服务器内GPU的降功耗电路包括降频控制芯片1，其工作原理为：

服务器的PSU在检测到自身输出功率大于预设过功率阈值(本申请可选用PSU的额定功率)时，生成过功率告警信号至降频控制芯片1。降频控制芯片1在接收到过功率告警信号后，生成降频控制信号至服务器内各GPU的PWRBRK引脚(全称power break引脚，即功率控制引脚)。每个GPU的PWRBRK引脚在接收到降频控制信号后，会将功耗降至当前功耗的1/N(N为正参数，N的取值取决于GPU内部所设置的降功耗策略，如N＝4)左右，从而使服务器的整机功耗以较快速度降至PSU可支持的范围内，以保证系统不掉电。

此外，本申请的PSU可选用PSU 1+1冗余架构，则降频控制芯片1与两个PSU连接，用于在接收到任一PSU生成的过功率告警信号后，均生成降频控制信号。由于本申请的GPU可实现快速降频响应，所以本申请可满足具有PSU 1+1冗余架构的服务器产品的设计要求。

在上述实施例的基础上：

请参照图2，图2为本发明实施例提供的一种服务器内GPU的降功耗电路的具体结构示意图。

作为一种可选的实施例，降功耗电路还包括：

分别与降频控制芯片1的输出端和各GPU的PWRBRK引脚连接的开关芯片2；

与开关芯片2的通道控制端子连接的控制电路3，用于根据服务器的整机功耗与PSU的额定功率的对比关系，从各GPU中确定需降频处理的目标GPU，并控制开关芯片2将降频控制芯片1和目标GPU之间的传输通道打开，以使降频控制信号输出至目标GPU的PWRBRK引脚，开启目标GPU的降频操作。

具体地，本申请的降功耗电路还包括开关芯片2(可选用FET Switch的芯片)和控制电路3，其工作原理为：

开关芯片2设于降频控制芯片1的输出端和各GPU的PWRBRK引脚之间的连接线路上，用于一一控制降频控制芯片1的输出端与各GPU的PWRBRK引脚之间的线路通断，可以理解的是，当降频控制芯片1的输出端与一GPU的PWRBRK引脚之间的线路连通时，降频控制芯片1生成的降频控制信号可输出至此GPU的PWRBRK引脚；当降频控制芯片1的输出端与一GPU的PWRBRK引脚之间的线路断开时，降频控制芯片1生成的降频控制信号无法输出至此GPU的PWRBRK引脚。

基于此，控制电路3分别获取服务器的整机功耗和PSU的额定功率，然后根据服务器的整机功耗与PSU的额定功率的对比关系，从服务器内所有GPU中确定需降频处理的目标GPU，目的是控制开关芯片2连通降频控制芯片1的输出端与目标GPU的PWRBRK引脚之间的线路，即将降频控制芯片1和目标GPU之间的传输通道打开，从而使降频控制芯片1生成的降频控制信号输出至目标GPU的PWRBRK引脚，开启目标GPU的降频操作。

作为一种可选的实施例，控制电路3包括：

与开关芯片2的通道控制端子连接的I/O扩展芯片；

与I/O扩展芯片连接的控制器，用于根据服务器的整机功耗与PSU的额定功率的对比关系，从各GPU中确定需降频处理的目标GPU，并通过I/O扩展芯片控制开关芯片2将降频控制芯片1和目标GPU之间的传输通道打开，以使降频控制信号输出至目标GPU的PWRBRK引脚。

具体地，本申请的控制电路3包括I/O(Input/Output，输入/输出)扩展芯片(可选用PCA9555型号的芯片)和控制器，其工作原理为：

开关芯片2的传输通道数量需大于等于服务器内GPU的总数量(如图3所示，服务器内设有4个GPU，本申请对此不做特别地限定)，且开关芯片2上设有用于一一控制传输通道打开或关闭的通道控制端子(如图3所示OE1-OE4)。考虑到控制器的I/O口有限，所以本申请的控制器通过I/O扩展芯片与开关芯片2的通道控制端子一一连接，以使控制器通过控制I/O扩展芯片的输出信号来控制开关芯片2的传输通道打开或关闭。

作为一种可选的实施例，控制器具体用于：

当P2+m×P3>P1时，将服务器中需降频处理的目标GPU的数量n从n＝1开始遍历，确定第一个满足关系式P2+P3/N×n+(m-n)×P3≤P1≤P2+P3/N×(n-1)+(m-n+1)×P3的整数k；其中，P1为PSU的额定功率，P2为服务器整机中除GPU外的其他部件总功耗，P3为单个GPU的功耗，m为服务器整机中GPU的总数量，N为预设参数；

当k≤m时，通过I/O扩展芯片控制开关芯片2打开降频控制芯片1和k个GPU之间的传输通道，以使降频控制信号输出至k个GPU的PWRBRK引脚；

当k>m时，通过I/O扩展芯片控制开关芯片2打开降频控制芯片1和m个GPU之间的传输通道，以使降频控制信号输出至m个GPU的PWRBRK引脚。

具体地，设PSU的额定功率为P1，服务器整机中除GPU外的其他部件总功耗为P2，单个GPU的功耗为P3，服务器整机中GPU的总数量为m，则：

1)若P2+m×P3≤P1，说明服务器的整机功耗未超出PSU所能支持的上限，则系统无需执行降频策略。

2)若P2+m×P3>P1，说明服务器的整机功耗超出PSU所能支持的上限，则系统需执行降频策略。设系统中需降频处理的目标GPU的数量为n，将n从n＝1开始遍历，找到第一个满足如下关系式的整数k：

P2+P3/4×n+(m-n)×P3≤P1≤P2+P3/4×(n-1)+(m-n+1)×P3。

当k≤m时，说明需对系统中k个GPU进行降频处理，即可满足降频后服务器的整机功耗低于PSU的额定功率，则此时控制器通过I/O扩展芯片控制开关芯片2打开降频控制芯片1和k个GPU之间的传输通道，以使降频控制芯片1生成的降频控制信号输出至k个GPU的PWRBRK引脚。

当k>m时，此时控制器通过I/O扩展芯片控制开关芯片2打开降频控制芯片1和所有GPU之间的传输通道，以使降频控制芯片1生成的降频控制信号输出至所有GPU的PWRBRK引脚。

作为一种可选的实施例，控制器通过PMBus总线与PSU连接；

且控制器还用于当k≤m时，降低PSU的过功率阈值。

进一步地，控制器通过PMBus总线(电源管理总线)与PSU连接，目的是当k≤m时，通过PMBus总线降低PSU的过功率阈值，从而更有效避免GPU降频操作生效前PSU过载。

作为一种可选的实施例，控制器具体用于当k≤m时，根据过功率阈值P＝P2+P3/N×k+(m-k)×P3修改PSU的过功率阈值，以降低PSU的过功率阈值。

具体地，当k≤m时，控制器可根据过功率阈值P＝P2+P3/N×k+(m-k)×P3修改PSU的过功率阈值，从而较为合理地降低PSU的过功率阈值。

作为一种可选的实施例，控制器还用于当k>m时，进行表征服务器在降频后的整机功耗仍超过PSU的额定功率的告警。

进一步地，考虑到当k>m时，即使对系统中全部的m个GPU进行降频处理，降频后服务器的整机功耗也会超出PSU的额定功率，所以当k>m时，控制器还进行表征服务器在降频后的整机功耗仍超过PSU的额定功率的告警，如控制BMC(Baseboard Manager Controller，基板管理控制器)的web界面进行告警提示，供用户查看。

作为一种可选的实施例，降频控制芯片1具体为服务器内的CPLD，控制器具体为服务器内的BMC。

具体地，本申请的降频控制芯片1可采用服务器内的CPLD(Complex Programmable Logic Device，CPLD)实现，控制器可采用服务器内的BMC实现，如图3所示，无需另外增设器件，节约了成本，简化了结构。

更具体地，BMC可通过PMBus总线读取PSU的额定功率，并通过I ²C总线读取GPU以及系统中其他部件的最大功耗，然后根据关系式P2+P3/4×n+(m-n)×P3≤P1≤P2+P3/4×(n-1)+(m-n+1)×P3，得到需要开启降频控制的GPU数量和PSU的过功率阈值的重新设定值。

本申请还提供了一种服务器，包括PSU和GPU，还包括上述任一种服务器内GPU的降功耗电路。

作为一种可选的实施例，PSU具体为PSU 1+1冗余架构。

本申请提供的服务器的介绍请参考上述降功耗电路的实施例，本申请在此不再赘述。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种服务器内GPU的降功耗电路，其特征在于，包括：

分别与服务器内的PSU和所述服务器内各GPU的PWRBRK引脚连接的降频控制芯片，用于在接收到所述PSU生成的过功率告警信号后，生成降频控制信号至各所述GPU的PWRBRK引脚，以开启各所述GPU的降频操作
如权利要求1所述的服务器内GPU的降功耗电路，其特征在于，所述降功耗电路还包括：

分别与所述降频控制芯片的输出端和各所述GPU的PWRBRK引脚连接的开关芯片；

与所述开关芯片的通道控制端子连接的控制电路，用于根据所述服务器的整机功耗与所述PSU的额定功率的对比关系，从各所述GPU中确定需降频处理的目标GPU，并控制所述开关芯片将所述降频控制芯片和所述目标GPU之间的传输通道打开，以使所述降频控制信号输出至所述目标GPU的PWRBRK引脚，开启所述目标GPU的降频操作。
如权利要求2所述的服务器内GPU的降功耗电路，其特征在于，所述控制电路包括：

与所述开关芯片的通道控制端子连接的I/O扩展芯片；

与所述I/O扩展芯片连接的控制器，用于根据所述服务器的整机功耗与所述PSU的额定功率的对比关系，从各所述GPU中确定需降频处理的目标GPU，并通过所述I/O扩展芯片控制所述开关芯片将所述降频控制芯片和所述目标GPU之间的传输通道打开，以使所述降频控制信号输出至所述目标GPU的PWRBRK引脚。
如权利要求3所述的服务器内GPU的降功耗电路，其特征在于，所述控制器具体用于：

当P2+m×P3>P1时，将所述服务器中需降频处理的目标GPU的数量n从n＝1开始遍历，确定第一个满足关系式P2+P3/N×n+(m-n)×P3≤P1≤P2+P3/N×(n-1)+(m-n+1)×P3的整数k；其中，P1为所述PSU的额定功率，P2 为所述服务器整机中除GPU外的其他部件总功耗，P3为单个GPU的功耗，m为所述服务器整机中GPU的总数量，N为预设参数；

当k≤m时，通过所述I/O扩展芯片控制所述开关芯片打开所述降频控制芯片和k个GPU之间的传输通道，以使所述降频控制信号输出至k个所述GPU的PWRBRK引脚；

当k>m时，通过所述I/O扩展芯片控制所述开关芯片打开所述降频控制芯片和m个GPU之间的传输通道，以使所述降频控制信号输出至m个所述GPU的PWRBRK引脚。
如权利要求4所述的服务器内GPU的降功耗电路，其特征在于，所述控制器通过PMBus总线与所述PSU连接；

且所述控制器还用于当k≤m时，降低所述PSU的过功率阈值。
如权利要求5所述的服务器内GPU的降功耗电路，其特征在于，所述控制器具体用于当k≤m时，根据过功率阈值P＝P2+P3/N×k+(m-k)×P3修改所述PSU的过功率阈值，以降低所述PSU的过功率阈值。
如权利要求4所述的服务器内GPU的降功耗电路，其特征在于，所述控制器还用于当k>m时，进行表征所述服务器在降频后的整机功耗仍超过所述PSU的额定功率的告警。
如权利要求3所述的服务器内GPU的降功耗电路，其特征在于，所述降频控制芯片具体为所述服务器内的CPLD，所述控制器具体为所述服务器内的BMC。
一种服务器，其特征在于，包括PSU和GPU，还包括如权利要求1-8任一项所述的服务器内GPU的降功耗电路。
如权利要求9所述的服务器，其特征在于，所述PSU具体为PSU1+1冗余架构。