CN115113714A - 大功率电源动态电流控制方法、装置、设备和存储介质 - Google Patents

大功率电源动态电流控制方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115113714A
CN115113714A CN202210770666.XA CN202210770666A CN115113714A CN 115113714 A CN115113714 A CN 115113714A CN 202210770666 A CN202210770666 A CN 202210770666A CN 115113714 A CN115113714 A CN 115113714A
Authority
CN
China
Prior art keywords
specification curve
current
psu
gpu
server system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210770666.XA
Other languages
English (en)
Other versions
CN115113714B (zh
Inventor
李松磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210770666.XA priority Critical patent/CN115113714B/zh
Publication of CN115113714A publication Critical patent/CN115113714A/zh
Application granted granted Critical
Publication of CN115113714B publication Critical patent/CN115113714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • G06F1/305Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations in the event of power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请涉及一种大功率电源动态电流控制方法、装置、设备和存储介质,方法包括:读取服务器系统相关设备对应的设备型号,获取设备型号对应的规格曲线,相关设备包括GPU以及PSU,设备型号对应的规格曲线包括PSU对应的第二规格曲线;计算服务器系统中除GPU和PSU的其他配置的总电流,并根据总电流得到第三规格曲线;比较第二规格曲线和第三规格曲线,根据比较结果判断服务器系统是否正常运行,若非正常运行,则对GPU或PSU的电流进行相应的调整。本发明既可以保证PSU最大利用率,又可以满足GPU的性能,提高了服务器的性能和效率,降低了服务器的成本,从而能够保证产品的竞争力。

Description

大功率电源动态电流控制方法、装置、设备和存储介质
技术领域
本申请涉及大功率电源的技术领域,特别是涉及一种大功率电源动态电流控制方法、装置、设备和存储介质。
背景技术
随着人工智能的时代来临,为了满足客户的各种需求和多项应用,各种各样的服务器应运而生,为了满足客户的计算或者深度学习需求,GPU(图形处理器)显卡应运而生,随着GPU性能的提高,其功率越来越大,其EDPp电流也越来越大,因此选择PSU(电源)时会考虑极端情况,保证服务器的稳定运行。
针对GPU的EDPp电流特性,在服务器开发前期,针对服务器电源模块,会对EDPp电流针对性的调整PSU的输出电流,以便满足GPU动态负载较大的问题。
目前按照业界PSU的设计,其peak current(峰值电流)最大可以达到PSU额定电流的1.7-1.8倍,若1.7-1.8倍还不能满足GPU的动态电流需求,则使用更大功率的电源来满足需求,但是随着GPU的发展,其EDPp电流越来越大,提高PSU的peak current会影响PSU的效率,因此不能一直提高;针对这种问题,只能选择更大功率的PSU,但是服务器的成本会越大,选择PSU较小时,还需要考虑均流特性,因此整个PSU选择会越大。
因此,亟需提出一种既可以保证PSU最大利用率又可以满足GPU性能,且能够降低服务器成本的大功率电源动态电流控制方法、装置、设备和存储介质。
发明内容
基于此,有必要针对上述现有技术中存在无法同时保证PSU和GPU最好性能且成本较高的问题,提供一种大功率电源动态电流控制方法、装置、设备和存储介质。
一方面,提供一种大功率电源动态电流控制方法,所述方法包括:
步骤A:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备包括GPU以及PSU,所述设备型号对应的规格曲线包括所述PSU对应的第二规格曲线;
步骤B:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,并根据所述总电流得到第三规格曲线;
步骤C:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
在其中一个实施例中,所述设备型号对应的规格曲线还包括所述GPU对应的第一规格曲线;所述根据所述总电流得到第三规格曲线,包括:将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线。
在其中一个实施例中,所述读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线包括:将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于存储芯片中,预先存储的所述设备型号对应的规格曲线为所述服务器系统历史运行数据;利用基本输入输出系统读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
在其中一个实施例中,所述计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,其计算公式包括:
Figure BDA0003723861390000021
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
在其中一个实施例中,基于预先设定的平面直角坐标系比较所述第二规格曲线和所述第三规格曲线,所述平面直角坐标系包括:以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上,所述直角坐标系仅包括第一象限。
在其中一个实施例中,比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行包括:基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上纵坐标值的大小:若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
在其中一个实施例中,所述方法还包括:若所述第三规格曲线小于所述第二规格曲线,预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于执行伺服器远端管理控制器中,以便于后续分析所述GPU工作特性。
在其中一个实施例中,所述若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整包括:实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流。
在其中一个实施例中,所述强制均流包括:利用所述执行伺服器远端管理控制器控制所述PSU的输出电流,强制拉高低于PSU平均电流值的PSU输出电流,当所述PSU的输出相等时,停止调整。
在其中一个实施例中,还包括:当所述强制均流后,仍存在所述PSU超规格使用情形,则计算所述GPU工作的最大电流;通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
在其中一个实施例中,所述GPU工作的最大电流计算公式包括:
Figure BDA0003723861390000041
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量。
在其中一个实施例中,包括:所述第一规格曲线为动态电流规格曲线;所述第二规格曲线为峰值电流规格曲线。
另一方面,提供了一种大功率电源动态电流控制装置,所述装置包括:
电流采集模块,用于读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线;
计算模块,用于计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
电流控制模块,用于比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU进行相应的调整。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
步骤A:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备包括GPU以及PSU,所述设备型号对应的规格曲线包括所述PSU对应的第二规格曲线;
步骤B:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,并根据所述总电流得到第三规格曲线;
步骤C:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
步骤A:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备包括GPU以及PSU,所述设备型号对应的规格曲线包括所述PSU对应的第二规格曲线;
步骤B:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,并根据所述总电流得到第三规格曲线;
步骤C:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
上述大功率电源动态电流控制方法、装置、设备和存储介质,所述方法包括:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线;计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。本发明通过预先设置的映射关系,可以直接根据设备型号提取其对应的规格曲线,提高了数据分析效率,进一步的,通过对电流的采集、计算分析,以及根据分析结果对PSU和GPU的电流进行控制调整,既可以保证PSU最大利用率,又可以满足GPU的性能,提高了服务器的性能和效率,降低了服务器的成本,从而能够保证产品的竞争力。
附图说明
图1为一个实施例中大功率电源动态电流控制方法的流程示意图;
图2为一个实施例中大功率电源动态电流控制装置的服务器系统主板端示意图;
图3为一个实施例中大功率电源动态电流控制装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如背景技术所述,目前按照业界PSU的设计,其peak current(峰值电流)最大可以达到PSU额定电流的1.7-1.8倍,若1.7-1.8倍还不能满足GPU的动态电流需求,则使用更大功率的电源来满足需求,但是随着GPU的发展,其EDPp(动态电流)电流越来越大,提高PSU的peak current会影响PSU的效率,因此不能一直提高,针对这种问题,只能选择更大功率的PSU,但是服务器的成本会越大,选择PSU较小时,还需要考虑均流特性,因此整个PSU选择会越大,无法同时保证PSU和GPU的最好的性能,从而导致服务器性能低、成本高。
为解决上述技术问题,本发明实施例中创造性的提出了一种大功率电源动态电流控制方法,该方法通过预先设置的映射关系,可以直接根据设备型号提取其对应的规格曲线,提高了数据分析效率,进一步的,通过对电流的采集、计算分析,以及根据分析结果对PSU和GPU的电流进行控制调整,既可以保证PSU最大利用率,又可以满足GPU的性能,提高了服务器的性能和效率,降低了服务器的成本,从而能够保证产品的竞争力。
实施例一
图1是根据一示例性实施例示出的大功率电源动态电流控制方法的流程图,参照图1所示,该方法包括如下步骤:
S1:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线;
需要说明的是,服务器系统相关设备包括GPU、PSU以及其他相关配置,例如芯片、系统总线、内存等其他相关配置,其设备对应的型号是基于出厂规格参数录入EEPROM(带电可擦可编程只读存储器,掉电后数据不丢失的存储芯片)中的,其对应的规格曲线数据是基于历史运行数据获得,将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于EEPROM中,所述映射关系为:
定义设备型号为A,所述设备型号A对应的规格曲线为B,形成的映射关系为A→B,示例性的,设备型号为NVIDIA GeForce GTX 1080 Ti,其对应的规格曲线为I,则形成的映射关系为NVIDIA GeForce GTX 1080 Ti→I;
利用BIOS(基本输入输出系统)读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
其中,第一规格曲线为EDPp规格曲线,第二规格曲线为peak current规格曲线,本申请至少包括一个GPU和PSU,GPU和PSU仅是不同设备型号对应的相关设备的总称,不代表具体的设备型号,即不同型号的GPU可以对应不同的EDPp规格曲线,同理,不同型号的PSU可以对应不同的peakcurrent规格曲线。
如上所述的,将设备型号和其对应规格曲线形成映射关系存储于EEPROM中,可以直接根据设备型号提取其对应的规格曲线,提高后续数据分析的效率。
S2:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
需要说明的是,计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流的计算公式包括:
Figure BDA0003723861390000071
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
示例性的,假设服务器系统的CPU数量为a,内存数量b,硬盘数量c,网卡数量d等等,服务器系统总电流则为单个CPU电流乘a+单个内存电流乘b+单个硬盘电流乘c+单个网卡电流乘d+…。
将计算得出的总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线,其中,上述的第一规格曲线、第二规格曲线和第三规格曲线均表示的是电流曲线,所述电流曲线所包括的时间点为24小时;
其中,所述总电流为某个时间点的总电流,所述时间点与规格曲线每个电流值所对应的时间点一一对应设置,示例性的,计算得出的是当天13点的总电流,则第一规格曲线也是13点所对应的电流值,将两个电流值相加得到第三规格曲线的13点所对应的电流值。
S3:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
具体的,以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,所述直角坐标系仅包括第一象限,即每个规格曲线的时间点和电流值都仅包含正值,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上,将规格曲线置于平面直角坐标系上可以直观的看出不同规格曲线相同时间点电流值的大小;
基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上的电流值大小:
若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
进一步的,当出现如下几种情况时,需要对所述服务器系统的相关运行电流进行相应的调整:
(1)GPU满负荷或超负荷运行:若所述第三规格曲线小于所述第二规格曲线,但预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于BMC(执行伺服器远端管理控制器)中,以便于后续分析所述GPU工作特性,示例性的,如GPU的负荷为230W,满负荷或者超负荷是指工作负荷为230W或者超出230W,其中,满负荷或超负荷运行情况是可以允许出现的;
(2)基于所述PSU的均流情况进行调整,即可能会出现部分所述PSU超出peakcurrent规格曲线的最大值,造成PSU保护,整机宕机的情况:实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流:利用所述BMC控制所述PSU的输出电流,强制拉高输出低于PSU平均电流值的PSU输出电流,当所述PSU的输出电流相等时,停止调整,其中,平均电流值是指用PSU的输出总电流除以PSU的数量,强制拉高输出较低的PSU输出电流至平均电流值,输出较高的PSU输出电流会自动降低至平均电流值,从而能够达到所有PSU输出电流相等的效果;
(3)当所述强制均流后,依然存在所述PSU超规格使用情形,则计算所述GPU工作的最大电流,所述GPU工作的最大电流计算公式包括:
Figure BDA0003723861390000091
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量;
通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
上述的大功率电源动态电流控制方法,读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线;计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。通过比较不同类型的规格曲线以及对PSU和GPU的整体进行相应的调整,可以保证PSU的最大利用率,同时还可以满足GPU的性能,从而能够降低服务器系统的成本,提高服务器系统的性能和效率,保证产品的竞争力。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
在一个实施例中,如图2所示,为服务器系统主板端,在所述主板端增加电流采集模块、计算模块和电流控制模块,则形成了本申请的一种大功率电源动态电流控制装置,如图3所示,所述装置包括:
电流采集模块,用于读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线,所述第一规格曲线为EDPp规格曲线,所述第二规格曲线为peak current规格曲线;
计算模块,所述计算模块与所述电流采集模块通信连接,用于计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
电流控制模块,所述电流控制模块与所述计算模块通信连接,用于比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU进行相应的调整。
具体的,根据所述服务器系统的配置正常的选择电源,由于GPU同时加压的概率较少,因此正常工作时PSU的输出功率较少,效率低,整个服务器系统的工作效率也很低,本申请通过增加电流采集模块、电流控制模块和计算模块,将各GPU和PSU的EDPp规格曲线及peak current规格曲线集成到计算模块中,计算模块根据采集到的设备型号,调出对应的曲线,服务器系统工作时实时采集其工作电流,实时进行对比和调整,保证服务器稳定运行。
其中,所述电流采集模块包括GPU电流采集模块、PSU电流采集模块和其他配置电流采集模块,包括:所述GPU电流采集模块用于读取所述GPU的型号、采集GPU的输出电流;所述PSU电流采集模块用于读取所述PSU的型号、采集PSU的输出电流;所述其他配置电流采集模块用于读取所述其他配置的型号、采集其他配置的输出电流;所述GPU电流采集模块、PSU电流采集模块和所述其他配置电流采集模块独立存在,当所述服务器系统工作时,同时采集并分开传送相关数据。
进一步的,电流控制模块包括比较判断模块和调整模块,所述比较判断模块用于比较不同的规格曲线并根据比较结果判断所述服务器系统是否正常运行,所述调整模块基于服务器非正常运行的判断结果对电流进行调整。
作为一种较优的实施方式,本发明实施例中,所述电流采集模块具体用于:
将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于EEPROM中,所述映射关系为:
定义设备型号为A,所述设备型号A对应的规格曲线为B,形成的映射关系为A→B;
利用BIOS读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
作为一种较优的实施方式,本发明实施例中,所述计算模块具体用于:
计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,其计算公式包括:
Figure BDA0003723861390000121
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
作为一种较优的实施方式,本发明实施例中,所述比较判断模块具体用于:
比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行包括:
以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,所述直角坐标系仅包括第一象限,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上;
基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上的电流值大小:
若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
作为一种较优的实施方式,本发明实施例中,所述比较判断模块具体还用于:
若所述第三规格曲线小于所述第二规格曲线,预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于BMC中,以便于后续分析所述GPU工作特性。
作为一种较优的实施方式,本发明实施例中,所述调整模块具体用于:
实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;
若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流:
利用所述BMC控制所述PSU的输出,强制拉高输出低于PSU平均电流值的PSU输出电流,当所述PSU的输出相等时,停止调整。
作为一种较优的实施方式,本发明实施例中,所述调整模块具体还用于:
当所述强制均流后,所述PSU存在超规格使用情形,则计算所述GPU工作的最大电流,所述GPU工作的最大电流计算公式包括:
Figure BDA0003723861390000131
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量;
通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
关于大功率电源动态电流控制装置的具体限定可以参见上文中对于大功率电源动态电流控制方法的限定,在此不再赘述。上述大功率电源动态电流控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例三
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种大功率电源动态电流控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
S1:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线,所述第一规格曲线为EDPp规格曲线,所述第二规格曲线为peak current规格曲线;
S2:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
S3:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于EEPROM中,所述映射关系为:
定义设备型号为A,所述设备型号A对应的规格曲线为B,形成的映射关系为A→B;
利用BIOS读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,其计算公式包括:
Figure BDA0003723861390000151
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行包括:
以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,所述直角坐标系仅包括第一象限,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上;
基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上的纵坐标值大小:
若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
若所述第三规格曲线小于所述第二规格曲线,预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于BMC中,以便于后续分析所述GPU工作特性。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;
若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流:
利用所述BMC控制所述PSU的输出电流,强制拉高输出低于PSU平均电流值的PSU输出电流,当所述PSU的输出相等时,停止调整。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
当所述强制均流后,依然存在所述PSU超规格使用情形,则计算所述GPU工作的最大电流,所述GPU工作的最大电流计算公式包括:
Figure BDA0003723861390000161
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量;
通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
实施例四
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
S1:读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线,所述第一规格曲线为EDPp规格曲线,所述第二规格曲线为peak current规格曲线;
S2:计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
S3:比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于EEPROM中,所述映射关系为:
定义设备型号为A,所述设备型号A对应的规格曲线为B,形成的映射关系为A→B;
利用BIOS读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,其计算公式包括:
Figure BDA0003723861390000171
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行包括:
以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,所述直角坐标系仅包括第一象限,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上;
基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上的纵坐标值大小:
若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若所述第三规格曲线小于所述第二规格曲线,预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于BMC中,以便于后续分析所述GPU工作特性。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;
若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流:
利用所述BMC控制所述PSU的输出电流,强制拉高输出低于PSU平均电流值的PSU输出电流,当所述PSU的输出相等时,停止调整。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当所述强制均流后,依然存在所述PSU超规格使用情形,则计算所述GPU工作的最大电流,所述GPU工作的最大电流计算公式包括:
Figure BDA0003723861390000181
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量;
通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种大功率电源动态电流控制方法,其特征在于,所述方法包括:
读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备包括GPU以及PSU,所述设备型号对应的规格曲线包括所述PSU对应的第二规格曲线;
计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,并根据所述总电流得到第三规格曲线;
比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整。
2.根据权利要求1所述的大功率电源动态电流控制方法,其特征在于,所述设备型号对应的规格曲线还包括所述GPU对应的第一规格曲线;
所述根据所述总电流得到第三规格曲线,包括:
将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线。
3.根据权利要求1或2所述的大功率电源动态电流控制方法,其特征在于,所述读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线包括:
将所述相关设备对应的设备型号与所述设备型号对应的规格曲线形成映射关系预先存储于存储芯片中,预先存储的所述设备型号对应的规格曲线为所述服务器系统历史运行数据;
利用基本输入输出系统读取所述服务器系统相关设备对应的设备型号,基于所述设备型号及所述映射关系自动生成对应的规格曲线,即所述设备型号对应的规格曲线。
4.根据权利要求1所述的大功率电源动态电流控制方法,其特征在于,所述计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,其计算公式包括:
Figure FDA0003723861380000021
其中,i表示设备类型,n表示设备类型总数,Pi表示电流之和,Xi表示同类型设备的设备数量,Yi表示同类型设备的单个设备电流。
5.根据权利要求2所述的大功率电源动态电流控制方法,其特征在于,基于预先设定的平面直角坐标系比较所述第二规格曲线和所述第三规格曲线,所述平面直角坐标系包括:
以时间点为横坐标、电流值为纵坐标建立平面直角坐标系,将所述第一规格曲线、第二规格曲线和第三规格曲线放置于所述平面直角坐标系上,所述直角坐标系仅包括第一象限。
6.根据权利要求5所述的大功率电源动态电流控制方法,其特征在于,比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行包括:
基于所述平面直角坐标系,比较所述第二规格曲线和第三规格曲线在相同时间点上纵坐标值的大小:
若所述第三规格曲线小于所述第二规格曲线,判断所述服务器系统运行正常。
7.根据权利要求6所述的大功率电源动态电流控制方法,其特征在于,所述方法还包括:
若所述第三规格曲线小于所述第二规格曲线,预设时间点数的第一规格曲线的纵坐标超出预设值,则将所述第一规格曲线、第二规格曲线和第三规格曲线的电流相关数据存储于执行伺服器远端管理控制器中,以便于后续分析所述GPU工作特性。
8.根据权利要求1所述的大功率电源动态电流控制方法,其特征在于,所述若非正常运行,则对所述GPU或所述PSU的电流进行相应的调整包括:
实时采集所述PSU的输出电流,将所述PSU的输出电流与所述PSU对应的第二规格曲线进行比较;
若所述PSU的输出电流超出所述第二规格曲线的最大值,则对所述PSU进行强制均流。
9.根据权利要求8所述的大功率电源动态电流控制方法,其特征在于,所述强制均流包括:
利用所述执行伺服器远端管理控制器控制所述PSU的输出电流,强制拉高低于PSU平均电流值的PSU输出电流,当所述PSU的输出相等时,停止调整。
10.根据权利要求9所述的大功率电源动态电流控制方法,其特征在于,还包括:
当所述强制均流后,仍存在所述PSU超规格使用情形,则计算所述GPU工作的最大电流;
通过所述BMC和电流控制模块降低所述GPU的输出,直至所述GPU的输出低于所述GPU工作的最大电流,用于保证所述服务器系统的正常运行。
11.根据权利要求10所述的大功率电源动态电流控制方法,其特征在于,所述GPU工作的最大电流计算公式包括:
Figure FDA0003723861380000031
其中,Imax表示GPU最大工作电流,s表示PSU最大规格电流,u表示GPU数量。
12.根据权利要求2所述的大功率电源动态电流控制方法,其特征在于,包括:
所述第一规格曲线为动态电流规格曲线;
所述第二规格曲线为峰值电流规格曲线。
13.一种大功率电源动态电流控制装置,其特征在于,包括:
电流采集模块,用于读取服务器系统相关设备对应的设备型号,获取所述设备型号对应的规格曲线,所述相关设备及其对应的规格曲线包括所述GPU对应的第一规格曲线和所述PSU对应的第二规格曲线;
计算模块,用于计算所述服务器系统中除所述GPU和所述PSU的其他配置的总电流,将所述总电流与所述GPU对应的第一规格曲线相加得到第三规格曲线;
电流控制模块,用于比较所述第二规格曲线和所述第三规格曲线,根据比较结果判断所述服务器系统是否正常运行,若非正常运行,则对所述GPU或所述PSU进行相应的调整。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
CN202210770666.XA 2022-06-30 2022-06-30 大功率电源动态电流控制方法、装置、设备和存储介质 Active CN115113714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210770666.XA CN115113714B (zh) 2022-06-30 2022-06-30 大功率电源动态电流控制方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210770666.XA CN115113714B (zh) 2022-06-30 2022-06-30 大功率电源动态电流控制方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN115113714A true CN115113714A (zh) 2022-09-27
CN115113714B CN115113714B (zh) 2023-07-21

Family

ID=83330386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210770666.XA Active CN115113714B (zh) 2022-06-30 2022-06-30 大功率电源动态电流控制方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115113714B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032449A (zh) * 2019-04-16 2019-07-19 苏州浪潮智能科技有限公司 一种优化gpu服务器的性能的方法及装置
CN111414069A (zh) * 2020-02-14 2020-07-14 苏州浪潮智能科技有限公司 一种gpu服务器的功耗控制方法、系统及相关组件
CN112162621A (zh) * 2020-09-11 2021-01-01 苏州浪潮智能科技有限公司 一种服务器电源强制均流的方法、系统、设备及介质
CN113204277A (zh) * 2021-04-29 2021-08-03 山东英信计算机技术有限公司 一种多功率cpu的过流保护方法、装置、设备及可读介质
CN113359970A (zh) * 2021-04-29 2021-09-07 山东英信计算机技术有限公司 服务器电源模组均流测试方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032449A (zh) * 2019-04-16 2019-07-19 苏州浪潮智能科技有限公司 一种优化gpu服务器的性能的方法及装置
CN111414069A (zh) * 2020-02-14 2020-07-14 苏州浪潮智能科技有限公司 一种gpu服务器的功耗控制方法、系统及相关组件
CN112162621A (zh) * 2020-09-11 2021-01-01 苏州浪潮智能科技有限公司 一种服务器电源强制均流的方法、系统、设备及介质
CN113204277A (zh) * 2021-04-29 2021-08-03 山东英信计算机技术有限公司 一种多功率cpu的过流保护方法、装置、设备及可读介质
CN113359970A (zh) * 2021-04-29 2021-09-07 山东英信计算机技术有限公司 服务器电源模组均流测试方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115113714B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
DE112006003628T5 (de) System und Verfahren zum Betreiben von Komponenten einer integrierten Schaltung mit unabhängigen Frequenzen und/oder Spannungen
CN103970256B (zh) 一种基于内存压缩和cpu动态调频的节能方法及系统
CN115129133A (zh) 一种服务器液冷系统调控装置、方法、终端及存储介质
CN116184828A (zh) 自适应汽轮机高调阀特性曲线在线实时优化方法与系统
CN113983543B (zh) 用于热力站循环泵控制的方法、装置、终端及存储介质
CN115344453A (zh) 服务器运行状态监控装置、方法、计算机设备和存储介质
CN111223007A (zh) 用户异常用电行为分析预警方法、装置、设备和介质
DE102019133492A1 (de) Leistungssparende Anzeige mit verbesserter Bildqualität
CN115113714A (zh) 大功率电源动态电流控制方法、装置、设备和存储介质
CN111680478A (zh) 基于组态软件的报表生成方法、装置、设备和存储介质
CN113792995B (zh) 电力资源支配程度的确定方法、装置、设备和存储介质
CN110910275A (zh) 基本用电数据获取方法、装置、计算机设备和存储介质
CN115793835A (zh) 一种调节负载线的方法、装置、设备及存储介质
CN110968947A (zh) 虚拟电厂调度方法、装置及系统
CN113900718B (zh) 一种bmc与bios资产信息的解耦方法、系统及装置
CN115576779A (zh) 服务器硬件信息的管理方法、装置、计算机设备和存储介质
CN112560210B (zh) 用于调整电网结构的方法、相关装置及计算机程序产品
CN110232202A (zh) 发电权交易效果评估方法、装置、计算机设备和存储介质
CN112686010B (zh) 资源数据报表生成方法、装置、计算机设备和存储介质
CN110969430B (zh) 可疑用户的识别方法、装置、计算机设备和存储介质
US20180173296A1 (en) Determination of an operating range of a processor using a power consumption metric
CN112488224A (zh) 模型训练方法、装置、计算机设备及存储介质
CN111125809A (zh) 建筑钢柱生成方法、装置、计算机设备和存储介质
CN109636162B (zh) 风电弃风电量的计算方法、装置、计算机设备和存储介质
CN114301058B (zh) 功率智能分配方法、系统和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant