CN116088651A - 控制芯片温度的方法、装置及存储介质 - Google Patents

控制芯片温度的方法、装置及存储介质 Download PDF

Info

Publication number
CN116088651A
CN116088651A CN202211450997.1A CN202211450997A CN116088651A CN 116088651 A CN116088651 A CN 116088651A CN 202211450997 A CN202211450997 A CN 202211450997A CN 116088651 A CN116088651 A CN 116088651A
Authority
CN
China
Prior art keywords
temperature
temperature data
chip
unit
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211450997.1A
Other languages
English (en)
Inventor
管金库
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Core Huazhang Technology Beijing Co ltd
Original Assignee
Core Huazhang Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Core Huazhang Technology Beijing Co ltd filed Critical Core Huazhang Technology Beijing Co ltd
Priority to CN202211450997.1A priority Critical patent/CN116088651A/zh
Publication of CN116088651A publication Critical patent/CN116088651A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Cooling Or The Like Of Semiconductors Or Solid State Devices (AREA)

Abstract

本申请提供一种控制芯片温度的方法、装置及存储介质。该方法包括经由所述控制单元确定所述芯片是否无法传输回第一温度数据,响应于确定所述芯片无法传输回第一温度数据,经由所述控制单元确定所述测温单元产生的第二温度数据,以及基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元进行散热。该装置包括:电路板、设置在电路板上的芯片、测温单元、控制单元和散热单元。

Description

控制芯片温度的方法、装置及存储介质
技术领域
本申请涉及芯片验证技术领域,尤其涉及一种控制芯片温度的方法、装置及存储介质。
背景技术
仿真工具(例如,原型验证板或硬件仿真工具(emulator))可以原型化(prototype)并且调试一个包括一个或多个模块的逻辑系统设计。所述逻辑系统设计可以是,例如,用于供专门应用的集成电路(Application Specific Integrated Circuit,简称ASIC)或者片上系统芯片(System-On-Chip,简称SOC)的设计。因此,在仿真工具中被测试的逻辑系统设计又可以称为待测设计(Design Under Test,简称DUT)。仿真工具可以通过一个或多个可配置组件(例如,现场可编程逻辑门阵列(Field Programmable Gate Array,简称FPGA))来仿真该待测设计,包括执行该待测设计的各种操作,从而在制造之前就测试并验证待测设计的各个模块的功能。通过在仿真工具上外接多种外设子卡还可以测试待测设计与各种外设作为一个完整系统进行运行的效果。
在仿真工具运行时,FPGA芯片会产生热量,导致FPGA芯片的温度上升。主机可以经由FPGA芯片内置的测温装置监控FPGA芯片的温度,以在FPGA芯片温度过高时及时采取降温措施。然而,当由于种种原因而致使内置的测温装置无法起作用时,就可能由于无法及时采取降温措施而使FPGA芯片温度过高,烧坏FPGA芯片。由于FPGA芯片十分昂贵,因此FPGA芯片烧坏会造成非常巨大的损失。
发明内容
本申请的第一方面提供一种控制芯片温的方法,所述芯片设置在电路板上,所述电路板在所述芯片之外还设置有一测温单元以及与所述测温单元通信耦接的控制单元,所述控制单元进一步连接到一散热单元,所述方法包括:
经由所述控制单元确定所述芯片是否无法传输回第一温度数据;
响应于确定所述芯片无法传输回第一温度数据,经由所述控制单元确定所述测温单元产生的第二温度数据;以及
基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元进行散热。
本申请的第二方面提供一种控制芯片温的装置,包括:电路板,所述电路板上设置有芯片,所述芯片具有内置温度传感器,用于产生第一温度数据;
测温单元,设置在所述电路板上,用于产生第二温度数据;
控制单元,通信耦接到所述芯片以及所述测温单元;
散热单元,通信耦接到所述控制单元,用于为所述电路板散热,
所述控制单元被配置为执行如第一方面所述的方法。
本申请的第三方面提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机的一组指令,该组指令用于在被执行时使所述计算机执行如第一方面所述的方法。
本申请提供的一种控制芯片温度的方法、装置及存储介质,通过在芯片周围设置外置测温单元的方式来监测芯片的温度变化,从而在芯片内置测温装置失灵时也能及时采取降温措施,防止芯片温度过高烧坏芯片。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本申请实施例的示例性主机100的结构示意图。
图2示出了根据本申请实施例的示例性仿真系统200的示意图。
图3A示出了根据本申请实施例的示例性控制芯片温度的装置300的示意图。
图3B示出了根据本申请实施例的示例性控制芯片温度的装置300的示意图。
图4示出了根据本申请实施例的一种控制芯片温度的方法的示例性热仿真的示意图。
图5示出了根据本申请实施例的示例性一种控制芯片温度的装置300的示意图。
图6示出了根据本申请实施例的示例性一种控制芯片温度的方法600的流程图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
如上所述,当由于种种原因而致使内置的测温装置无法起作用时,就可能由于无法及时采取降温措施而使FPGA芯片温度过高,烧坏FPGA芯片。由于FPGA芯片十分昂贵,因此FPGA芯片烧坏会造成非常巨大的损失。这些原因可以包括:测温装置(例如,温度传感器)故障、FPGA与主机的通信故障等。由于仿真工具经常会在无人监管的情况下长时间工作,一旦出现测温故障很难有人工介入的条件。因此,如何在FPGA芯片出现测温故障时依然保持对FPGA芯片的温度感知是一个亟待解决的问题。
本申请提供的一种控制芯片温度的方法、装置及存储介质,通过在芯片周围设置外置测温单元并利用模型预估芯片温度来监测芯片的温度变化,从而在芯片内置测温装置失灵时也能及时采取降温措施,防止芯片温度过高烧坏芯片。
图1示出了根据本申请实施例的示例性主机100的结构示意图。主机100可以是运行仿真系统的电子设备。如图1所示,主机100可以包括:处理器102、存储器104、网络接口106、外围接口108和总线110。其中,处理器102、存储器104、网络接口106和外围接口108通过总线110实现彼此之间在电子设备内部的通信连接。
处理器102可以是中央处理器(Central Processing Unit,CPU)、图像处理器、神经网络处理器(NPU)、微控制器(MCU)、可编程逻辑器件、数字信号处理器(DSP)、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路。处理器102可以用于执行与本申请描述的技术相关的功能。在一些实施例中,处理器102还可以包括集成为单一逻辑组件的多个处理器。如图1所示,处理器102可以包括多个处理器102a、102b和102c。
存储器104可以配置为存储数据(例如,指令集、计算机代码、中间数据等)。在一些实施例中,用于仿真测试设计的仿真测试系统可以是存储器104中存储的计算机程序。如图1所示,存储器存储的数据可以包括程序指令(例如,用于实现本申请的定位错误的方法的程序指令)以及要处理的数据(例如,存储器可以存储在编译过程产生的临时代码)。处理器102也可以访问存储器存储的程序指令和数据,并且执行程序指令以对要处理的数据进行操作。存储器104可以包括易失性存储装置或非易失性存储装置。在一些实施例中,存储器104可以包括随机访问存储器(RAM)、只读存储器(ROM)、光盘、磁盘、硬盘、固态硬盘(SSD)、闪存、存储棒等。
网络接口106可以配置为经由网络向主机100提供与其他外部设备的通信。该网络可以是能够传输和接收数据的任何有线或无线的网络。例如,该网络可以是有线网络、本地无线网络(例如,蓝牙、WiFi、近场通信(NFC)等)、蜂窝网络、因特网、或上述的组合。可以理解的是,网络的类型不限于上述具体示例。在一些实施例中,网络接口106可以包括任意数量的网络接口控制器(NIC)、射频模块、接收发器、调制解调器、路由器、网关、适配器、蜂窝网络芯片等的任意组合。
外围接口108可以配置为将主机100与一个或多个外围装置连接,以实现信息输入及输出。例如,外围装置可以包括键盘、鼠标、触摸板、触摸屏、麦克风、各类传感器等输入设备以及显示器、扬声器、振动器、指示灯等输出设备。
总线110可以被配置为在主机100的各个组件(例如处理器102、存储器104、网络接口106和外围接口108)之间传输信息,诸如内部总线(例如,处理器-存储器总线)、外部总线(USB端口、PCI-E总线)等。
需要说明的是,尽管上述电子设备架构仅示出了处理器102、存储器104、网络接口106、外围接口108和总线110,但是在具体实施过程中,该电子设备架构还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述电子设备架构中也可以仅包含实现本申请实施例方案所必需的组件,而不必包含图中所示的全部组件。
图2示出了根据本申请实施例的仿真系统200的示意图。
如图2所示,仿真系统200可以包括仿真工具202以及与仿真工具202连接的主机100。
仿真工具202是一种用于仿真待测设计(DUT)的硬件系统。仿真工具202可以是原型验证板或者硬件仿真工具(emulator)。一个待测设计可以包括多个模块。待测设计可以是组合逻辑电路、时序逻辑电路、或上述两者的组合。仿真工具202可以包括一个或多个可配置电路(例如,FPGA),用于仿真待测设计。
仿真工具202可以包括接口单元2022,用于与主机100通信地耦接,以进行主机100和仿真工具202之间的通信。在一些实施例中,接口单元2022可以包括具有电连接能力的一个或多个接口。例如,接口单元2022可以包括RS232接口、USB接口、LAN口、光纤接口、IEEE1394(火线接口)等。在一些实施例中,接口单元2022可以是无线网络接口。例如,接口单元2022可以是WIFI接口、蓝牙接口等。
主机100可以经由接口单元2022向仿真工具202传输编译后的DUT、调试指令等。仿真工具202也可以经由接口单元2022向主机100传输仿真数据等。
仿真工具202还可以包括存储器1024,用于存储在仿真过程中待测设计产生的仿真数据(例如,各种信号值)。在一些实施例中,仿真过程中待测设计产生的信号值可以直接被主机100读取。可以理解的是,存储器1024也可以独立仿真工具202,例如,使用一种外接存储器。
除了连接到主机100,仿真工具202还可以经由接口单元2022连接到一个或多个子卡204。
子卡用于在使用仿真工具202进行原型验证时向DUT提供外设以构成完整的电子系统。原型验证是指在芯片流片之前,尽可能地还原芯片真实使用场景,验证芯片功能是否准确和完整的一种验证方式。子卡204可以包括存储器子卡(例如,提供DDR内存接口)、通信子卡(例如,提供多种网络接口或无线网卡接口)等。
主机100可以用于配置仿真工具202以仿真一个待测设计。该待测设计可以是一个完整的逻辑系统设计或一个完整逻辑系统设计的一个或多个模块。在一些实施例中,主机100可以是云计算系统中的一个虚拟主机。逻辑系统设计(例如,ASIC或者System-On-Chip)可以由硬件描述语言(例如Verilog、VHDL、System C、或System Verilog)设计。
主机100可以从用户接收调试待测设计的请求。如上所述,待测设计可以包括一个或多个模块。待测设计的描述可以用硬件描述语言来完成。主机100可以基于待测设计的描述来进行综合,以生成,例如,待测设计的门级电路网表(未示出)。待测设计的该门级电路网表可以被载入仿真工具202中运行,进而可以在仿真工具202中形成与待测设计相对应的电路结构。因此,待测设计的电路结构可以根据该描述而获得,并且相应地,待测设计中的每个块的电路结构也可以类似地获得。
图3A示出了根据本申请实施例的示例性控制芯片温度的装置300的示意图。该装置300可以是图2的仿真系统200的一部分。如图3A所示,控制芯片温度的装置300可以包括电路板302、散热单元304,以及设置在电路板302上的测温单元306、控制单元308和芯片3024。在一些实施例中,该芯片可以是FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)3024。如图3A所示,控制单元308可以分别与散热单元304、FPGA3024以及测温单元306通信地耦接(例如,通过图1的总线110实现通信耦接),从而控制单元308可以向散热单元304、FPGA3024以及测温单元306发送控制信号以令这些单元执行相应的操作。可以理解,在一些实施例中,控制单元308也可以不设置在电路板302上,而是可以独立于电路板302单独设置,如图3B所示。可选地,控制单元308还可以由图1的主机100的处理器102来实现。
仿真系统200在工作时(例如,在使用仿真工具202对被测设计进行仿真时),FPGA3024通常会产生热量,从而使FPGA 3024的温度升高。如不及时对FPGA 3024采取降温措施,则会导致FPGA 3024被烧坏。因此,在一些实施例中,FPGA 3024内部可以设置有内置温度传感器3026,如图3A所示。该内置温度传感器3026可以实时测量FPGA 3024内部的温度,并生成第一温度数据3028。然后,FPGA 3024可以通过内置的温度测量电路将第一温度数据3028输出到控制单元308。当FPGA 3024的温度过高时,控制单元308可以控制散热单元及时采取降温措施,以防止FPGA 3024烧坏。
然而,当内置温度传感器3026损坏或者无法通过总线110将第一温度数据传输给控制单元308时,控制单元308将无法对FPGA 3024的温度进行监控,可能存在不能很好地为FPGA 3024进行降温、散热的问题,严重时可能导致系统崩溃。鉴于此,在一些实施例中,可以采用外置的备用测温装置来对FPGA 3024的温度进行实时监测。
如图3A所示,在一些实施例中,测温单元306可以是外置的备用测温装置。当控制单元308确定FPGA 3024无法传输回第一温度数据3028(例如,在给定的时间段内控制单元308没有收到任何温度数据3028或者温度数据3028明显异常),控制单元308可以获取测温单元306产生的第二温度数据3062。然后,控制单元308可以基于该第二温度数据3062来控制散热单元304进行散热。这样,当控制单元308无法获取第一温度数据3028时,通过获取测温单元306产生的第二温度数据3062来控制散热单元304,也能实现对FPGA 3024的散热。
如图3A所示,由于测温单元306设置在电路板302上,而不是设置在FPGA 3024上,因此,测温单元306产生的第二温度数据3062并不能够直接反映FPGA 3024的实际温度。如果直接根据测温单元306产生的第二温度数据3062控制散热单元304进行散热的话,可能会由于第二温度数据3062不能准确地反应FPGA 3024的实际温度而造成散热单元304不能及时对FPGA 3024进行散热。鉴于此,可以通过建立第一温度数据3028和第二温度数据3026的温度模型,进而基于该温度模型来控制散热单元304对FPGA 3024进行散热。进而,在一些实施例中,可以根据该温度模型,通过获取测温单元306产生的第二温度数据3062来控制散热单元304进行散热。该温度模型可以反映第一温度数据3028和第二温度数据3026的对应关系,这样就可以根据第二温度数据3026预估第一温度数据3028,进而据此控制散热单元304。
在一些实施例中,温度模型可以由控制单元308读取第一温度数据3028和第二温度数据3062,再将第一温度数据3028和第二温度数据3062进行一定关系的拟合得到(例如,可以用最小二乘法进行近似拟合)。在又一些实施例中,还可以将大量的第一温度数据3028和第二温度数据3062作为机器学习模型的训练集,将训练好的机器学习模型作为该温度模型,以得到相对准确的温度模型预估结果。可选地,用于构建该温度模型的温度数据除了可以通过控制单元308直接读取获得外,还可以通过对电路板302进行热仿真得到。
在进行热仿真时,可以根据环境温度的高低以及FPGA不同功耗的情况,做出几组不同的热仿真数据。还可以在FPGA周围不同的位置设置测温单元来进行热仿真。这样,可以得到不同位置的温度数据和FPGA温度数据的对应关系。可以理解,如图4所示,FPGA所在的位置5的温度相对较高,而越远离FPGA的位置温度越低(例如,位置2的温度小于位置1、位置3和位置4的温度)。鉴于此,在一些实施例中,可以在FPGA所在的位置5周围的不同位置(例如,位置1、位置2、位置3和位置4)放置测温单元,以得到不同位置的测温单元产生的温度数据,再根据温度数据得到对应位置处的温度模型。这样,使用四个位置处任意一个测温单元测温,都可以根据对应位置处的温度模型,预估FPGA的温度。
图5示出了根据本申请实施例的示例性控制芯片温度的装置300的另一示意图。
如图5所示,在一些实施例中,电路板302上可以设置多个FPGA 3024,相应地,可以在多个FPGA 3024的周围设置多个测温单元306,从而可以更好地对每个FPGA 3024进行测温。控制单元308可以分别与散热单元304、FPGA 3024以及测温单元306通信地耦接,并可以设置在电路板302上,也可以独立于电路板302之外。可选地,测温单元306的设置位置可以根据前述的热仿真方法而确定,从而更好地实现对温度的预估和对散热单元304的控制。
在一些实施例中,如图5所示,散热单元304可以是风扇,且风扇的数量可以为一个或者多个。可选地,当风扇为一个时,该风扇可以是仿真工具202中已有的风扇,并通过控制单元308与测温单元306耦接,这样利用已有的风扇可以节约设备成本。在一些实施例中,当风扇为多个时,多个风扇通过控制单元308与测温单元306耦接,这样当其中一个风扇损坏时,还可以控制其它风扇进行散热。可选地,风扇为多个时,还可以根据FPGA 3024温度的高低控制启动多个风扇进行散热,这样可以起到快速降温的作用。可以理解,散热单元304为风扇时,可以设置多个不同的温度阈值,并根据不同的温度阈值对应调整风扇的转速。
在设置不同的温度阈值,进而使风扇的转速可以相应地进行调整时,在一些实施例中,可以根据FPGA的最大运行温度和一定的温度范围确定需要风扇满速运行时FPGA达到的温度阈值(例如,FPGA的最大运行温度为85℃,将温度范围设为5℃,此时,将80℃确定为需要风扇满速运行时FPGA达到的温度阈值)。再根据构建的温度模型,预估在FPGA达到80℃时,测温单元生成的温度数据,将该温度数据作为第一阈值。该第一阈值即表明当控制单元读取到测温单元生成的第二温度数据达到或者超过第一阈值时,需要控制风扇满速运行,以使FPGA能够快速降温。
当FPGA的温度下降,不需要风扇满速运行时,在一些实施例中,可以设置当FPGA的温度降为正常运行温度时,使风扇低速运行。类似地,在进行设置时,根据构建的温度模型,预估当FPGA以正常温度运行时,测温单元生成的温度数据,将该温度数据设为第二阈值。当控制单元308读取测温单元306生成的第二温度数据,并确定该第二温度数据低于或等于第二阈值时,表明风扇对FPGA 3024的散热效果较好,FPGA 3024的温度已下降,风扇无需继续满速运行。此时,控制单元308控制风扇低速运行。
当FPGA的温度达到某一温度值后不再降低,或者FPGA的温度达到某一温度值后反而又继续升高时,说明风扇的散热效果不好,没能使FPGA的温度有效地下降。在一些实施例中,在这种情况下,可以根据FPGA 3024的最大运行温度和一定的温度范围确定一个FPGA的温度阈值,再根据构建的温度模型,预估该温度阈值对应的测温单元生成的温度数据,将该温度数据作为第三阈值(例如,FPGA的最大运行温度为85℃,将温度范围设为3℃,则FPGA的温度阈值为82℃。再根据温度模型确定82℃对应的第三阈值)。当测温单元生成的第二温度数据高于或等于第三阈值时,经由风扇降温的FPGA的温度不再下降,或者又继续升高,此时说明风扇的散热效果不好,或者不起作用。在这种情况下,需要控制单元308启动内部温度防控机制关闭主FPGA业务功能,同时控制风扇继续运行;或者直接控制单板工作电源停止供电,以防止FPGA烧坏。
需要说明的是,上述为测温单元生成的温度数据设置不同温度阈值的实施例仅是示例性的,在具体实施过程中,在设置不同的温度阈值时,还可以根据FPGA的温度和一定的温度范围,为FPGA的温度设置不同的温度阈值。在这种情况下,通过构建的温度模型,根据测温单元测量到的温度,预估FPGA的实际温度后,再将该实际温度与不同的温度阈值进行比较,根据比较结果控制风扇以不同的速度运行。
如图5所示,在一些实施例中,测温单元306位于电路板302上,并设置在FPGA 3024的周围。由于FPGA 3024的数量可以为多个,因此,可以在FPGA 3024的周围设置多个测温单元306,并可以根据电路板302上的进风口(未示出)或者出风口(未示出)的位置进行放置。通过在FPGA 3024周围设置多个测温单元306,即使其中一个测温单元306出现问题,那么其他的测温单元306依旧可以反映芯片的温度。此外,这样的设置方式,当更换测温单元306时,由于测温单元306不在FPGA 3024的内部,所以不会因为测温单元306的失灵而损毁FPGA3024,这样避免了损毁芯片带来的损失。
图6示出了根据本申请实施例的示例性一种控制芯片温度的方法600的流程图,其中,方法600可以由控制芯片温度的装置300执行。方法600可以包括如下步骤。
在步骤602,经由所述控制单元(例如,图3A的控制单元308)确定所述芯片(例如,图3A的FPGA 3024)是否无法传输回第一温度数据。正常情况下,FPGA 3024的温度通过总线(例如,图1的总线110)传输。
在步骤604,响应于确定所述芯片无法传输回第一温度数据,经由所述控制单元确定所述测温单元(例如,图3A的测温单元306)产生的第二温度数据。当FPGA 3024的内置温度传感器(例如,图3A的内置温度传感器3026)失灵或者用来传递温度信息的总线失效时,根据测温单元306确定是否需要对FPGA 3024进行散热。如图5所示,首先控制单元308确定测温单元306测到的所在位置的温度(即第二温度数据)。
在一些实施例中,响应于确定所述芯片传输回第一温度数据,所述方法可以进一步包括:经由所述控制单元读取第一温度数据和第二温度数据,根据所述第一温度数据和所述第二温度数据确定所述温度模型,所述温度模型包括所述第一温度数据和所述第二温度数据之间的对应关系。在利用外置测温单元306对芯片采取降温措施之前,如图4所示,可以首先通过热仿真得到芯片温度和测温单元所在位置温度的对应关系,该对应关系是通过对控制单元读取的芯片的温度(第一温度数据)和测温单元所在位置的温度(第二温度数据)进行热仿真得到的。
在一些实施例中,所述方法可以进一步包括:对所述电路板(例如,图3A的电路板302)进行热仿真,根据所述热仿真的结果确定所述温度模型,所述温度模型包括所述第一温度数据和所述第二温度数据之间的对应关系。
在步骤606,基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元(例如,图3A中的散热单元304)进行散热。如图5所示,控制单元308可以控制多个散热单元304对FPGA 3024进行散热,也可以控制一个散热单元304对FPGA 3024进行散热。
在一些实施例中,基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元进行散热,可以进一步包括:基于所述第二温度数据根据所述温度模型预估所述芯片的温度,根据预估的所述芯片的温度控制所述散热单元进行散热。当预估的芯片的温度超过芯片的温度阈值时,由控制单元控制散热单元进行散热。
在一些实施例中,散热单元可以是风扇,所述方法进一步包括:确定所述第二温度数据是否高于或等于第一阈值,响应于所述第二温度数据高于或等于所述第一阈值,控制所述散热单元以第一转速运行。根据芯片实际的温度阈值和一定的预设温度范围,预设一个芯片温度阈值,再根据温度模型确定该预设的芯片的温度阈值对应的测温单元生成的温度数据,将该温度数据作为第一阈值。例如,如果芯片实际的温度阈值为85℃时,将预设温度范围设为5℃,即可以预设芯片的温度阈值为80℃。通过温度模型确定80℃对应的第二温度数据,将该第二温度数据作为第一阈值。当第二温度达到或者高于第一阈值时,控制风扇满速运行。
作为一个可选实施例,确定所述第二温度数据是否低于或等于第二阈值,响应于所述第二温度数据低于或等于所述第二阈值,控制所述散热单元以第二转速运行。根据温度模型,将芯片的正常温度对应的第二温度数据确定为第二阈值,当风扇满速运行对芯片散热时,芯片的温度下降,此时测温单元生成的第二温度数据达到或者低于第二阈值时,控制风扇按照系统预设的正常速度运行。
作为一个可选实施例,确定所述第二温度数据是否高于或等于第三阈值,响应于所述第二温度数据高于或等于所述第三阈值,停止所述芯片的运行。根据芯片的温度阈值和一定的预设温度范围,再预设一个芯片温度阈值,根据温度模型确定该预设的芯片的温度阈值对应的测温单元生成的温度数据,将该温度数据作为第三阈值。例如,如果芯片实际的温度阈值为85℃时,将预设温度范围设为3℃,即可以预设芯片的温度阈值为82℃。通过温度模型确定82℃对应的第二温度数据,将该第二温度数据作为第三阈值。当测温单元生成的第二温度数据达到或者高于第三阈值时,说明芯片的温度未能降低,或者芯片的温度持续升高,此时需要启动内部温度防控机制关闭主芯片业务功能,同时风扇可以继续运行降温;或者单板工作电源停止供电,以保护贵重主芯片。
本申请实施例还提供一种非暂态计算机可读存储介质。该非暂态计算机可读存储介质存储计算机的一组指令,该组指令用于在被执行时使该电子控制装置执行方法600。
上述对本申请的一些实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请的不同方面的许多其它变化,为了简明它们没有在细节中提供。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种控制芯片温度的方法,所述芯片设置在电路板上,所述电路板在所述芯片之外还设置有一测温单元以及与所述测温单元通信耦接的控制单元,所述控制单元进一步连接到一散热单元,所述方法包括:
经由所述控制单元确定所述芯片是否无法传输回第一温度数据;
响应于确定所述芯片无法传输回第一温度数据,经由所述控制单元确定所述测温单元产生的第二温度数据;以及
基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元进行散热。
2.如权利要求1所述的方法,响应于确定所述芯片传输回第一温度数据,所述方法进一步包括:
经由所述控制单元读取第一温度数据和第二温度数据;
根据所述第一温度数据和所述第二温度数据确定所述温度模型,所述温度模型包括所述第一温度数据和所述第二温度数据之间的对应关系。
3.如权利要求1所述的方法,进一步包括:
对所述电路板进行热仿真;
根据所述热仿真的结果确定所述温度模型,所述温度模型包括所述第一温度数据和所述第二温度数据之间的对应关系。
4.如权利要求1所述的方法,其中,基于所述第二温度数据经由所述控制单元根据温度模型控制所述散热单元进行散热进一步包括:
基于所述第二温度数据根据所述温度模型预估所述芯片的温度;
根据预估的所述芯片的温度控制所述散热单元进行散热。
5.如权利要求1所述的方法,其中,所述散热单元是风扇,所述方法进一步包括:
确定所述第二温度数据是否高于或等于第一阈值;
响应于所述第二温度数据高于或等于所述第一阈值,控制所述散热单元以第一转速运行;或
确定所述第二温度数据是否低于或等于第二阈值;
响应于所述第二温度数据低于或等于所述第二阈值,控制所述散热单元以第二转速运行;或者
确定所述第二温度数据是否高于或等于第三阈值;
响应于所述第二温度数据高于或等于所述第三阈值,停止所述芯片的运行。
6.一种控制芯片温度的装置,包括:
电路板,所述电路板上设置有芯片,所述芯片具有内置温度传感器,用于产生第一温度数据;
测温单元,设置在所述电路板上,用于产生第二温度数据;
控制单元,通信耦接到所述芯片以及所述测温单元;
散热单元,通信耦接到所述控制单元,用于为所述芯片散热,
所述控制单元被配置为执行如权利要求1-5的任一项所述的方法。
7.如权利要求6所述的装置,其中,所述电路板包括多个测温单元,所述控制单元根据所述多个测温单元的数据确定所述第二温度数据。
8.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储电子装置的一组指令,该组指令用于使所述电子装置执行权利要求1至5任一项所述的方法。
CN202211450997.1A 2022-11-18 2022-11-18 控制芯片温度的方法、装置及存储介质 Pending CN116088651A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211450997.1A CN116088651A (zh) 2022-11-18 2022-11-18 控制芯片温度的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211450997.1A CN116088651A (zh) 2022-11-18 2022-11-18 控制芯片温度的方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN116088651A true CN116088651A (zh) 2023-05-09

Family

ID=86205319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211450997.1A Pending CN116088651A (zh) 2022-11-18 2022-11-18 控制芯片温度的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116088651A (zh)

Similar Documents

Publication Publication Date Title
CN106133640B (zh) 使用电源监控器校准电源
CN102411526B (zh) 一种用于刀片服务器主板的测试方法
US10863653B2 (en) Thermal testing system and method of thermal testing
CN115146568B (zh) 一种基于uvm的芯片验证系统及验证方法
CN111145826B (zh) 一种存储器内建自测试方法、电路及计算机存储介质
CN112100957B (zh) 用于调试逻辑系统设计的方法、仿真器、存储介质
US8756466B2 (en) Method and system thereof for optimization of power consumption of scan chains of an integrated circuit for test
US6477659B1 (en) Measuring timing margins in digital systems by varying a programmable clock skew
US9384107B2 (en) Improper voltage level detection in emulation systems
TWI743851B (zh) 快速周邊組件互連插槽檢測系統
CN116088651A (zh) 控制芯片温度的方法、装置及存储介质
TWI772643B (zh) 用於測試電腦系統之裝置及方法
US10288496B1 (en) Ring oscillator for temperature or voltage sensing
TW202147113A (zh) 片上熱、功率分配網路和電網可靠性的現場監控
CN113806148B (zh) 快速周边组件互连插槽检测系统
US11175708B2 (en) Thermal simulation for management controller development projects
CN111208889A (zh) 一种服务器温度控制方法及系统、基板管理控制器
US20130268221A1 (en) On-chip integrated circuit power measurement cell
CN105589530B (zh) 一种电子系统和管理半导体芯片的使用的方法
JP6230092B2 (ja) 監視システム
US20210173989A1 (en) Simulation signal viewing method and system for digital product
US9794120B2 (en) Managing network configurations in a server system
CN115983192B (zh) 验证系统及配置验证系统的外设子卡资源的方法
US20210173994A1 (en) Method and system for viewing simulation signals of a digital product
TW201827994A (zh) 電子裝置與其控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination