CN114564093B - 一种设备散热方法、装置、电子设备及存储介质 - Google Patents

一种设备散热方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114564093B
CN114564093B CN202210158108.8A CN202210158108A CN114564093B CN 114564093 B CN114564093 B CN 114564093B CN 202210158108 A CN202210158108 A CN 202210158108A CN 114564093 B CN114564093 B CN 114564093B
Authority
CN
China
Prior art keywords
fpga board
power consumption
target
heat dissipation
board card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210158108.8A
Other languages
English (en)
Other versions
CN114564093A (zh
Inventor
计晶
刘铁军
董培强
韩大峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210158108.8A priority Critical patent/CN114564093B/zh
Publication of CN114564093A publication Critical patent/CN114564093A/zh
Application granted granted Critical
Publication of CN114564093B publication Critical patent/CN114564093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种设备散热方法、装置、电子设备及存储介质。该方法包括:读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;根据运行参数确定FPGA板卡对应的整体功耗值,以及确定FPGA板卡核心区域对应的核心功耗值;从设置于FPGA板卡核心区域的温度传感器中读取温度值;基于整体功耗值、核心功耗值以及温度值确定FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定目标工作状态对应的目标散热策略,并根据目标散热策略对FPGA板卡执行相应的散热操作。本申请实施例提供的方法能够将依据FPGA板卡整体功耗值、核心功耗值以及核心区域的温度值能够精准的确定工作状态,同时依据工作状态确定散热策略,节省了与外部散热设备适配的过程。

Description

一种设备散热方法、装置、电子设备及存储介质
技术领域
本申请涉及领域,尤其涉及一种设备散热方法、装置、电子设备及存储介质。
背景技术
FPGA具有可定制性、低延迟和高性能功耗比,因此FPGA板卡用于机器学习推理、图像语音识别、大数据分析,通常部署到机房或者数据中心的服务器中为用户带来更先进的AI计算加速解决方案。但是FGPA加速卡功耗通常较大,散热设计比较重要,有效的目标散热策略不仅可以节省能耗,提高FPGA板卡工作效率,而且可以减小散热器尺寸,节省空间。而散热最有效的办法是设计加速卡散热器,由于FPGA板卡通常设计成PCIe卡,散热器的设计按照尺寸大小可分为单宽散热器和双宽散热器,按照是否自带风扇分为主动散热器和被动散热器。因此FPGA板卡散热器常见种类有:单宽主动散热器、双宽主动散热器、单宽被动散热器、双宽被动散热器,按照不同的散热需求,可设计选择不同的散热器。
在实现本发明的过程中,发明人发现目前的散热方法主要是根据FPGA板卡当前的整体功耗调节外部散热装置实现板卡散热调节。然而使用整体功耗在调节散热装置的散热参数时,无论散热装置为主动散热器还是被动散热器,都需要做服务器散热适配。一方面适配过程较长,且依据整体功耗调节散热参数的散热效果较差。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种设备散热方法、装置、电子设备及存储介质。
根据本申请实施例的一个方面,提供了一种设备散热方法,应用于复杂可编程逻辑器件,所述方法还包括:
读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;
根据所述运行参数确定所述FPGA板卡对应的整体功耗值,以及确定所述FPGA板卡核心区域对应的核心功耗值;
从设置于所述FPGA板卡核心区域的温度传感器中读取温度值;
基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,并根据所述目标散热策略对所述FPGA板卡执行相应的散热操作。
进一步的,所述基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,包括:
在所述整体功耗值、所述核心功耗值以及所述温度值落入第一预设范围的情况下,确定所述FPGA板卡的目标状态为低功耗运行状态;
获取功耗值与转速之间的对应关系表;
基于所述对应关系表,确定所述整体功耗值、核心功耗值以及所述温度值对应的散热器风扇和服务器风扇对应的转速,将所述散热器风扇和服务器风扇对应的转速确定为所述目标散热策略。
进一步的,所述基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,包括:
在所述整体功耗值、所述核心功耗值以及所述温度值落入第二预设范围的情况下,确定所述FPGA板卡的目标状态为高功耗运行状态;
获取功耗值与转速之间的对应关系表;
基于所述对应关系表,确定所述整体功耗值、核心功耗值以及所述温度值对应的散热器风扇和服务器风扇对应的转速,并确定所述FPGA板卡执行的降频指令,将所述散热器风扇和服务器风扇对应的转速以及所述降频指令确定为所述目标散热策略。
进一步的,在根据所述目标散热策略对所述FPGA板卡执行相应的散热操作之后,所述方法还包括:
按照预设时间间隔获取所述FPGA板卡核心区域的温度变化数据;
在所述温度变化数据小于预设变化数据的情况下,向所述FPGA板卡发送降频指令,以使所述FPGA板卡按照所述降频指令执行降频操作。
根据本申请实施例的另一个方面,还提供了一种设备散热方法,应用于FPGA板卡,所述方法包括:
接收来自于复杂可编程逻辑器件的目标散热策略,其中,所述目标散热策略中包括降频指令;
确定所述FPGA板卡中用于执行所述降频指令的目标FIFO分块;
依据所述降频指令调节所述目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,其中,所述第二时钟周期的周期小于所述第一时钟周期。
进一步的,所述方法还包括:
获取由所述FPGA板卡外部的数据输入设备传输的待处理数据;
调用第三时钟周期将所述待处理数据传输至所述FPGA板卡内部的IP内核;
通过所述IP内核将所述待处理数据传输至所述FPGA中的FIFO分块集合,以使所述FIFO分块集合中的目标FIFO分块按照所述第二时钟周期处理所述待处理数据,以及所述FIFO分块集合中除目标FIFO分块之外的FIFO分块按照所述第一时钟周期处理所述待处理数据。
根据本申请实施例的另一个方面,还提供了一种设备散热装置,包括:
第一读取模块,用于读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;
确定模块,用于根据所述运行参数确定所述FPGA板卡对应的整体功耗值,以及确定所述FPGA板卡核心区域对应的核心功耗值;
第二读取模块,用于从设置于所述FPGA板卡核心区域的温度传感器中读取温度值;
处理模块,用于基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,并根据所述目标散热策略对所述FPGA板卡执行相应的散热操作。
根据本申请实施例的另一个方面,还提供了一种设备散热装置,包括:
接收模块,用于接收来自于复杂可编程逻辑器件的目标散热策略,其中,所述目标散热策略中包括降频指令;
确定模块,用于确定所述FPGA板卡中用于执行所述降频指令的目标FIFO分块;
调节模块,用于依据所述降频指令调节所述目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,其中,所述第二时钟周期的周期小于所述第一时钟周期。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的方法能够将依据FPGA板卡整体功耗值、核心功耗值以及核心区域的温度值能够准确的定位当前FPGA板卡的工作状态,同时依据工作状态确定散热策略,节省了与外部散热设备适配的过程,提高了FPGA板卡的散热效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种设备散热方法的流程图;
图2为本申请实施例提供的一种设备散热系统的示意图;
图3为本申请另一实施例提供的一种设备散热方法的流程图;
图4为本申请实施例提供的一种数据处理过程示意图;
图5为本申请实施例提供的一种数据处理过程示意图;
图6为本申请实施例提供的一种设备散热装置的框图;
图7为本申请另一实施例提供的一种设备散热装置的框图;
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种设备散热方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为描述方便,后续简称为电子设备。
根据本申请实施例的一方面,提供了一种设备散热方法的方法实施例。图1为本申请实施例提供的一种设备散热方法的流程图,如图1所示,该方法包括:
步骤S11,读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数。
本申请实施例提供的方法应用于复杂可编程逻辑器件,复杂可编程逻辑器件部署于设备散热系统,如图2所示,该系统包括:复杂可编程逻辑器件(CPLD)和FPGA板卡,PGA加速卡是X16 PCIe卡,支持4路DDR4,2路QSFP,CPLD充当加速卡的BMC功能,控制FPGA的上下电时序,管理监控整板功耗、温度、报警等信息,同时与Host端的BMC通过SMBUS通信。
在本申请实施例中,复杂可编程逻辑器件通过电源管理总线(Power ManagementBus,缩写:PMBUS)读取电编程熔丝(eFUSE)和电压调节器模块(Voltage RegulatorModule,缩写:VRM)的相关信息,如电流、电压、温度等运行参数。其中eFUSE是电源进入板卡供电前的总开关,起到过流保护、过压保护、欠压保护、过温保护以及热插拔功能,通过PMBUS通信接口可以读取上述相关信息;VRM是FPGA主要电源供电模块。
步骤S12,根据运行参数确定FPGA板卡对应的整体功耗值,以及确定FPGA板卡核心区域对应的核心功耗值。
在本申请实施例中,复杂可编程逻辑器件可以依据收集到的运行参数确定FPGA板卡对应的整体功耗值,同时可以从运行参数中提取出属于FPGA板卡核心区域的器件对应的目标运行参数,然后依据目标运行参数计算FPGA板卡核心区域对应的核心功耗值。
步骤S13,从设置于FPGA板卡核心区域的温度传感器中读取温度值。
在本申请实施例中,复杂可编程逻辑器件通过I2C读取温度传感器的温度值,需要说明的是,温度传感器布局在FPGA板卡核心区域的发热位置,同时复杂可编程逻辑器件可通过I2C读写Clock Generator时钟相关信息。
步骤S14,基于整体功耗值、核心功耗值以及温度值确定FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定目标工作状态对应的目标散热策略,并根据目标散热策略对FPGA板卡执行相应的散热操作。
在本申请实施例中,步骤S14,基于整体功耗值、核心功耗值以及温度值确定FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定目标工作状态对应的目标散热策略,包括以下步骤A1-A3:
步骤A1,在整体功耗值、核心功耗值以及温度值落入第一预设范围的情况下,确定FPGA板卡的目标状态为低功耗运行状态。
步骤A2,获取功耗值与转速之间的对应关系表。
步骤A3,基于对应关系表,确定整体功耗值、核心功耗值以及温度值对应的散热器风扇和服务器风扇对应的转速,将散热器风扇和服务器风扇对应的转速确定为目标散热策略。
在本申请实施例中,在确定整体功耗值和核心功耗值后,首先将整体功耗值和核心功耗值与预设阈值进行对比,从而确定FPGA板卡当前的功耗是否较高,如果整体功耗值、核心功耗值以及温度值落入第一预设范围,则确定FPGA板卡当前的功耗较低。此时可以使用外部散热方式对FPGA板卡进行散热。
具体的,获取功耗值、温度与转速之间的对应关系表(参考表1),可以从对应关系表中获取整体功耗值、核心功耗值以及温度值对应的主散热器风扇和服务器风扇的转速,以及对应的被动散热器风扇以及服务器风扇的转速。
作为一个示例,第一功耗为a1,第二功耗为a2,以及温度值a3,此时对应的主动散散热器风扇的转速为m1,服务器风扇m2,被动散热器风扇n1,服务器风扇n2。其中,a1、a2、a3、m1、m2、n1以及n2可以是具体数值,也可以是数值范围。
表1功耗值、温度与转速之间的对应关系表
在本申请实施例中,步骤S14,基于整体功耗值、核心功耗值以及温度值确定FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定目标工作状态对应的目标散热策略,包括以下步骤B1-B3:
步骤B1,在整体功耗值、核心功耗值以及温度值落入第二预设范围的情况下,确定FPGA板卡的目标状态为高功耗运行状态;
步骤B2,获取功耗值与转速之间的对应关系表;
步骤B3,基于对应关系表,确定整体功耗值、核心功耗值以及温度值对应的散热器风扇和服务器风扇对应的转速,并确定FPGA板卡执行的降频指令,将散热器风扇和服务器风扇对应的转速以及降频指令确定为目标散热策略。
在本申请实施例中,如果整体功耗值、核心功耗值以及温度值落入第二预设范围,则确定FPGA板卡当前的功耗较高。此时如果仍然使用外部散热方式对FPGA板卡进行散热,无法满足FPGA板卡的散热需求。因此就需要将FPGA板卡发送降频指令,以使FPGA板卡依据降频指令降低自身在数据处理过程中的时钟周期,从而实现自身散热,最终满足散热需求。因此在FPGA板卡的功耗较高的情况下,在目标散热策略中加入降频指令,从而满足FPGA板卡的散热需求。
在本申请实施例中,当FPGA板卡的功耗较低时,一方面可以通过调节散热器风扇或者服务器风扇散热,另一方面当FPGA板卡的功耗较高时可以自动降频处理数据,降低功耗,配合风扇实现散热,提升能耗比。
本申请实施例提供的方法能够将依据FPGA板卡整体功耗值、核心功耗值以及核心区域的温度值能够准确的定位当前FPGA板卡的工作状态,同时依据工作状态确定散热策略,节省了与外部散热设备适配的过程,提高了FPGA板卡的散热效率。
在本申请实施例中,在根据目标散热策略对FPGA板卡执行相应的散热操作之后,方法还包括以下步骤C1-C2:
步骤C1,按照预设时间间隔获取FPGA板卡核心区域的温度变化数据。
在本申请实施例中,复杂可编程逻辑器件在按照目标散热策略执行完相应的散热需求后,会按照预设时间间隔采集FPGA板卡核心区域的温度,然后依据多个时间段对应的温度值绘制温度变化数据。
步骤C2,在温度变化数据小于预设变化数据的情况下,向FPGA板卡发送降频指令,以使FPGA板卡按照降频指令执行降频操作。
在本申请实施例中,如果温度变化数据小于预设变化数据,且当前的目标散热策略为外部散热方式的情况下,复杂可编程逻辑器件会向FPGA板卡发送降频指令,以使FPGA板卡按照降频指令执行降频操作。需要说明的是,目标散热策略为外部散热方式,即目标散热策略中仅仅包括:主散热器风扇和服务器风扇的转速,以及被动散热器风扇以及服务器风扇的转速。
本申请实施例提供的方法,通过在对FPGA板卡执行完散热操作后,会按照时间间隔采集FPGA板卡的温度,得到FPGA板卡的温度变化数据,并在温度变化数据不满足预设变化数据的情况下,使FPGA板卡执行降频指令,从而满足FPGA板卡的散热需求。
图3为本申请实施例提供的一种设备散热方法的流程图,如图3所示,该方法可以包括以下步骤:
步骤S21,接收来自于复杂可编程逻辑器件的目标散热策略,其中,目标散热策略中包括降频指令。
本申请实施例提供方法应用于FPGA板卡,FPGA板卡会接收来自于复杂可编程器件的目标散热策略,目标散热策略中包括降频指令,降频指令用于降低FPGA板卡中的部分FIFO分块的时钟周期。
步骤S22,确定FPGA板卡中用于执行降频指令的目标FIFO分块。
在本申请实施例中,由于FPGA板卡中包括多个FIFO分块,因此可以按照预设比例从FPGA板卡中选择目标FIFO分块,目标FIFO分块用于执行降频指令的FIFO分块。
步骤S23,依据降频指令调节目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,其中,第二时钟周期的周期小于第一时钟周期。
在本申请实施例中,FPGA板卡会按照降频指令调节目标FIFO分块的时钟周期,以将目标FIFO分块的时钟周期由第一时钟周期(CLOCK_1)变更为第二时钟周期(CLOCK_2)。
在本申请实施例中,方法还包括以下步骤D1-D3:
步骤D1,获取由FPGA板卡外部的数据输入设备传输的待处理数据。
步骤D2,调用第三时钟周期将待处理数据传输至FPGA板卡内部的IP内核。
步骤D3,通过IP内核将待处理数据传输至FPGA中的FIFO分块集合,以使FIFO分块集合中的目标FIFO分块按照第二时钟周期处理待处理数据,以及FIFO分块集合中除目标FIFO分块之外的FIFO分块按照第一时钟周期处理待处理数据。
在本申请实施例中,FPGA内部逻辑处理降频,自动降低功耗,减小散热压力。如图4所示外部数据与FPGA通过光口进行交互,首先是外部数据通过光口连接器与FPGA的高速IO连接,然后进入FPGA内部IP,通过IP输出的用户数据经过分块FIFO进行逻辑处理。
作为一个示例,如图4所示,CLOCK_0(第三时钟周期)是外部Clock Generator生成的时钟提供给FPGA的光口IP,CLOCK_1(第一时钟周期)是FPGA输出的时钟给光口使用,CLOCK_2(第二时钟周期)是外部Clock Generator生成的时钟提供FPGA用于逻辑数据处理。
当FPGA数据处理逻辑块运行较快且较多,就会导致功耗增加,散热需求提升,此时可以通过降低目标FIFO时钟实现数据降频处理,FIFO时钟可选CLOCK_1(第一时钟周期)和CLOCK_2(第二时钟周期),CLOCK_2(第二时钟周期)时钟周期一般小于CLOCK_1(第一时钟周期),而且CLOCK_2(第二时钟周期)可以通过I2C调节Clock Generator产生不同时钟频率,因此降频处理选用时钟CLOCK_2(第二时钟周期)。以上示例是外部数据输入FPGA板卡,同理FPGA数据输出光口,可进行同样操作进行降频处理,实现降低功耗,配合风扇转速调节实现散热。
作为另一个示例,PCIe数据处理也可以实现降频处理数据,如图5所示,不同之处在于PCIe的IP与光口的IP不同,另外PCIe的时钟CLOCK_0(第三时钟周期)来自Host端,其余处理过程与上述实施例相同。
图6为本申请实施例提供的一种设备散热装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,该装置包括:
第一读取模块61,用于读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;
确定模块62,用于根据运行参数确定FPGA板卡对应的整体功耗值,以及确定FPGA板卡核心区域对应的核心功耗值;
第二读取模块63,用于从设置于FPGA板卡核心区域的温度传感器中读取温度值;
处理模块64,用于基于整体功耗值、核心功耗值以及温度值确定FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定目标工作状态对应的目标散热策略,并根据目标散热策略对FPGA板卡执行相应的散热操作。
在本申请实施例中,处理模块64,用于在整体功耗值、核心功耗值以及温度值落入第一预设范围的情况下,确定FPGA板卡的目标状态为低功耗运行状态;获取功耗值与转速之间的对应关系表;基于对应关系表,确定整体功耗值、核心功耗值以及温度值对应的散热器风扇和服务器风扇对应的转速,将散热器风扇和服务器风扇对应的转速确定为目标散热策略。
在本申请实施例中,处理模块64,用于在整体功耗值、核心功耗值以及温度值落入第二预设范围的情况下,确定FPGA板卡的目标状态为高功耗运行状态;获取功耗值与转速之间的对应关系表;基于对应关系表,确定整体功耗值、核心功耗值以及温度值对应的散热器风扇和服务器风扇对应的转速,并确定FPGA板卡执行的降频指令,将散热器风扇和服务器风扇对应的转速以及降频指令确定为目标散热策略。
在本申请实施例中,设备散热装置还包括:检测模块,用于按照预设时间间隔获取FPGA板卡核心区域的温度变化数据;在温度变化数据小于预设变化数据的情况下,向FPGA板卡发送降频指令,以使FPGA板卡按照降频指令执行降频操作。
图7为本申请实施例提供的一种设备散热装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示,该装置包括:
接收模块71,用于接收来自于复杂可编程逻辑器件的目标散热策略,其中,目标散热策略中包括降频指令;
确定模块72,用于确定FPGA板卡中用于执行降频指令的目标FIFO分块;
调节模块73,用于依据降频指令调节目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,其中,第二时钟周期的周期小于第一时钟周期。
在本申请实施例中,设备散热装置还包括:处理模块,用于获取由FPGA板卡外部的数据输入设备传输的待处理数据;调用第三时钟周期将待处理数据传输至FPGA板卡内部的IP内核;通过IP内核将待处理数据传输至FPGA中的FIFO分块集合,以使FIFO分块集合中的目标FIFO分块按照第二时钟周期处理待处理数据,以及FIFO分块集合中除目标FIFO分块之外的FIFO分块按照第一时钟周期处理待处理数据。
本申请实施例还提供一种电子设备,如图8所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。
存储器1503,用于存放计算机程序;
处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例的步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的设备散热方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的设备散热方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk)等。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种设备散热方法,应用于复杂可编程逻辑器件,其特征在于,所述方法还包括:
读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;
根据所述运行参数确定所述FPGA板卡对应的整体功耗值,以及确定所述FPGA板卡核心区域对应的核心功耗值;
从设置于所述FPGA板卡核心区域的温度传感器中读取温度值;
基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,并根据所述目标散热策略对所述FPGA板卡执行相应的散热操作;
所述基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,包括:
在所述整体功耗值、所述核心功耗值以及所述温度值落入第二预设范围的情况下,确定所述FPGA板卡的目标状态为高功耗运行状态;
获取功耗值与转速之间的对应关系表;
基于所述对应关系表,确定所述整体功耗值、核心功耗值以及所述温度值对应的散热器风扇和服务器风扇对应的转速,并确定所述FPGA板卡执行的降频指令,将所述散热器风扇和服务器风扇对应的转速以及所述降频指令确定为所述目标散热策略;
所述降频指令调节目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,以使所述目标FIFO分块按照所述第二时钟周期处理数据,其中,所述第二时钟周期的周期小于所述第一时钟周期,所述目标FIFO分块是FPGA板卡中用于执行所述降频指令的FIFO分块。
2.根据权利要求1所述的方法,其特征在于,所述基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡当前的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,包括:
在所述整体功耗值、所述核心功耗值以及所述温度值落入第一预设范围的情况下,确定所述FPGA板卡的目标状态为低功耗运行状态;
获取功耗值与转速之间的对应关系表;
基于所述对应关系表,确定所述整体功耗值、核心功耗值以及所述温度值对应的散热器风扇和服务器风扇对应的转速,将所述散热器风扇和服务器风扇对应的转速确定为所述目标散热策略。
3.根据权利要求2所述的方法,其特征在于,在根据所述目标散热策略对所述FPGA板卡执行相应的散热操作之后,所述方法还包括:
按照预设时间间隔获取所述FPGA板卡核心区域的温度变化数据;
在所述温度变化数据小于预设变化数据的情况下,向所述FPGA板卡发送降频指令,以使所述FPGA板卡按照所述降频指令执行降频操作。
4.一种设备散热方法,应用于FPGA板卡,其特征在于,所述方法包括:
接收来自于复杂可编程逻辑器件的降频指令;
确定所述FPGA板卡中用于执行所述降频指令的目标FIFO分块;
依据所述降频指令调节所述目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,以使所述目标FIFO分块按照所述第二时钟周期处理数据,其中,所述第二时钟周期的周期小于所述第一时钟周期;
其中,所述降频指令是所述复杂可编程逻辑器件在根据目标散热策略对所述FPGA板卡执行相应的散热操作后,且FPGA板卡核心区域的温度变化数据小于预设变化数据时生成的,所述目标散热策略是基于所述FPGA板卡的目标工作状态确定的,所述目标工作状态是基于所述FPGA板卡对应的整体功耗值,所述FPGA板卡核心区域对应的核心功耗值,所述FPGA板卡核心区域的温度值确定的。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取由所述FPGA板卡外部的数据输入设备传输的待处理数据;
调用第三时钟周期将所述待处理数据传输至所述FPGA板卡内部的IP内核;
通过所述IP内核将所述待处理数据传输至所述FPGA中的FIFO分块集合,以使所述FIFO分块集合中的目标FIFO分块按照所述第二时钟周期处理所述待处理数据,以及所述FIFO分块集合中除目标FIFO分块之外的FIFO分块按照所述第一时钟周期处理所述待处理数据。
6.一种设备散热装置,其特征在于,包括:
第一读取模块,用于读取FPGA板卡对应的板卡开关以及电压调节器模块运行参数;
确定模块,用于根据所述运行参数确定所述FPGA板卡对应的整体功耗值,以及确定所述FPGA板卡核心区域对应的核心功耗值;
第二读取模块,用于从设置于所述FPGA板卡核心区域的温度传感器中读取温度值;
处理模块,用于基于所述整体功耗值、所述核心功耗值以及所述温度值确定所述FPGA板卡的目标工作状态,基于工作状态与散热策略之间的对应关系,确定所述目标工作状态对应的目标散热策略,并根据所述目标散热策略对所述FPGA板卡执行相应的散热操作;
所述处理模块,用于在所述整体功耗值、所述核心功耗值以及所述温度值落入第二预设范围的情况下,确定所述FPGA板卡的目标状态为高功耗运行状态;获取功耗值与转速之间的对应关系表;基于所述对应关系表,确定所述整体功耗值、核心功耗值以及所述温度值对应的散热器风扇和服务器风扇对应的转速,并确定所述FPGA板卡执行的降频指令,将所述散热器风扇和服务器风扇对应的转速以及所述降频指令确定为所述目标散热策略;
所述降频指令调节目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,以使所述目标FIFO分块按照所述第二时钟周期处理数据,其中,所述第二时钟周期的周期小于所述第一时钟周期,所述目标FIFO分块是FPGA板卡中用于执行所述降频指令的FIFO分块。
7.一种设备散热装置,其特征在于,包括:
接收模块,用于接收来自于复杂可编程逻辑器件的目标散热策略,其中,所述目标散热策略中包括降频指令;
确定模块,用于确定FPGA板卡中用于执行所述降频指令的目标FIFO分块;
调节模块,用于依据所述降频指令调节所述目标FIFO分块的时钟周期由第一时钟周期变更为第二时钟周期,其中,所述第二时钟周期的周期小于所述第一时钟周期;
其中,所述降频指令是所述复杂可编程逻辑器件在根据目标散热策略对所述FPGA板卡执行相应的散热操作后,且FPGA板卡核心区域的温度变化数据小于预设变化数据时生成的,所述目标散热策略是基于所述FPGA板卡的目标工作状态确定的,所述目标工作状态是基于所述FPGA板卡对应的整体功耗值,所述FPGA板卡核心区域对应的核心功耗值,所述FPGA板卡核心区域的温度值确定的。
8.一种存储介质,其特征在于,所述存储介质存储有程序,其中,所述程序在计算机运行时,由计算机执行上述权利要求1至5中任一项所述的方法步骤。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1-5中任一项所述的方法步骤。
CN202210158108.8A 2022-02-21 2022-02-21 一种设备散热方法、装置、电子设备及存储介质 Active CN114564093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210158108.8A CN114564093B (zh) 2022-02-21 2022-02-21 一种设备散热方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210158108.8A CN114564093B (zh) 2022-02-21 2022-02-21 一种设备散热方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114564093A CN114564093A (zh) 2022-05-31
CN114564093B true CN114564093B (zh) 2023-08-08

Family

ID=81713462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210158108.8A Active CN114564093B (zh) 2022-02-21 2022-02-21 一种设备散热方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114564093B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116225192B (zh) * 2023-05-08 2023-08-01 之江实验室 一种散热系统的控制方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614293A (zh) * 2018-12-13 2019-04-12 广东浪潮大数据研究有限公司 一种fpga异构加速卡的管理系统及方法
CN112261579A (zh) * 2020-10-22 2021-01-22 珠海格力电器股份有限公司 设备节能控制方法、装置、设备及计算机可读介质
WO2021027298A1 (zh) * 2019-08-13 2021-02-18 华为技术有限公司 一种散热元件的控制方法及控制装置
CN113645085A (zh) * 2021-10-15 2021-11-12 苏州浪潮智能科技有限公司 智能网卡的异常检测方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9354903B2 (en) * 2012-07-24 2016-05-31 Beijing Lenovo Software Ltd. Control method and electronic device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614293A (zh) * 2018-12-13 2019-04-12 广东浪潮大数据研究有限公司 一种fpga异构加速卡的管理系统及方法
WO2021027298A1 (zh) * 2019-08-13 2021-02-18 华为技术有限公司 一种散热元件的控制方法及控制装置
CN112261579A (zh) * 2020-10-22 2021-01-22 珠海格力电器股份有限公司 设备节能控制方法、装置、设备及计算机可读介质
CN113645085A (zh) * 2021-10-15 2021-11-12 苏州浪潮智能科技有限公司 智能网卡的异常检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN114564093A (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN101221464A (zh) 存储器模块的热管理
CN114564093B (zh) 一种设备散热方法、装置、电子设备及存储介质
US20140337496A1 (en) Embedded Management Controller for High-Density Servers
CN113031672A (zh) 温度控制方法、系统及存储介质
US9804980B2 (en) System management through direct communication between system management controllers
CN113204466B (zh) 一种过温保护方法和电子设备
CN102473108B (zh) 外壳气流控制器
US20140317267A1 (en) High-Density Server Management Controller
US9319313B2 (en) System and method of forwarding IPMI message packets based on logical unit number (LUN)
CN111141034B (zh) 吹风机控制方法、装置及存储介质
CN111550426B (zh) 一种温度调节方法、装置、终端设备及存储介质
CN113677164A (zh) 电控盒的散热控制方法、装置以及空调器
US7237130B2 (en) Blade server performance management method and system
CN109032324B (zh) 数据中心功率管控方法、装置、设备及计算机可读介质
US20070086160A1 (en) System and method for cooling a cpu passively
CN108509018A (zh) 一种控制方法及电子设备、存储介质
CN111090560A (zh) 一种存储设备的散热方法和设备
JP2020141215A (ja) 電子機器、端末、処理方法、温度上昇抑制システム、制御プログラム、および記憶媒体
CN112463683B (zh) 一种存储系统及其数据压缩卡
CN111274096B (zh) 一种多i2c通道温度监测模块和服务器
CN113301765B (zh) 服务器散热部件运行状态控制方法,服务器系统和服务器
CN114498507B (zh) 导电排冷却系统及其控制方法、控制装置、电子设备
WO2024124908A1 (zh) 服务器控制方法、装置、设备及存储介质
CN114172116B (zh) 一种制板控制方法及电子设备
US20240195322A1 (en) Hybrid voltage regulator architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant